Database
 sql >> Datenbank >  >> RDS >> Database

Verbinden unterschiedlicher Datenquellen im Layering

Der Vergleich von Daten aus zwei verschiedenen Datenquellen ist etwas, das normalerweise viele verschiedene bewegliche Teile erfordert, insbesondere wenn Sie daran interessiert sind, eine Visualisierung dieser neuen Daten zu erstellen.

Im SQL-Modus von Chartio können Sie, wie in den meisten SQL-Editoren, diese Art von Join schreiben und diese beiden Tabellen verbinden, WENN sie sich in derselben Datenquelle befinden. Mit dem Schema-Editor können Sie vorgeben, wie zwei solcher Tabellen im interaktiven Modus verknüpft werden, d. h. WENN sie sich in derselben Datenquelle befinden. Sie können dies nicht mit zwei unterschiedlichen und separaten Datenquellen tun. Hier kommt Chartios Layering ins Spiel.

Wie SQL einen Join erstellen kann

In der SQL-Syntax geschieht das Verbinden zweier Tabellen in der FROM-Klausel, und der Befehl ist sehr einfach JOIN. Syntaktisch sieht das etwa so aus:

_SELECT p.id, p.name, p.city, p.state, s.score_
_FROM public.person_info as p_
_INNER JOIN public.score_info as s ON p.id = s.id_
  • Was wir hier gemacht haben, sind diese beiden Tabellen:

  • Und verband sie buchstäblich zu einer Tabelle mit den Ergebnissen, wo sich die beiden Tabellen in der Spalte „id“ schneiden.
  • Der Join kann mit dieser Animation erklärt werden

  • Die resultierende Tabelle ist eine Kombination aus beidem und sieht folgendermaßen aus:

Wie Sie anhand der Animation und der resultierenden Tabelle oben sehen können, zeigen die vom INNER JOIN zurückgegebenen Elemente NUR Zeilen, in denen sich die ID in BEIDEN Tabellen befindet, mit den spezifischen Spalten, die in der SELECT-Klausel erwähnt werden. Das ist der Kern von JOINS in SQL:Bring mir Daten aus mehreren Tabellen, in denen sich eine Spalte, die in beiden Tabellen vorhanden ist, schneidet. Dies ist die grundlegendste Form von JOIN, dem INNER JOIN. Es gibt verschiedene Möglichkeiten, wie diese Tabellen verknüpft werden können, oder verschiedene Verknüpfungstypen, und diese können anhand von Venn-Diagrammen wie den unten gezeigten erklärt werden.

Wie Chartio-Ebenen Verbindungen erstellen

Im interaktiven Modus von Chartio können Sie zwei Quellen mit Ebenen verbinden. Die Grundlagen sind hier ziemlich einfach, Sie müssen nur ein paar Schritte befolgen, um die zugrunde liegenden Abfragen einzurichten, um die beiden Tabellen zu erstellen, die verknüpft werden sollen. Wie die Ebenen Verbindungen herstellen, ist ziemlich ähnlich wie Excel die VLOOKUP-Funktion verwenden könnte. Durch Auswahl eines Datenpipeline-Schritts zum Zusammenführen von Ebenen (im interaktiven Modus erfolgt dies durch Hinzufügen einer neuen Ebene durch Klicken auf das Pluszeichen „+“ unter dem Datenexplorer) weisen Sie Chartio an, die Tabellen zu übernehmen, die sich aus den anfänglichen Abfragen in der ergeben spezifische Syntax der spezifischen Datenquellen und führen Sie sie in den sich überschneidenden Zeilen in den ausgewählten Spalten zusammen.

Der Unterschied besteht darin, dass Sie im interaktiven Modus in Chartio diktieren, dass diese Spalten mit den ersten 1, 2, 3 usw. Spalten links von den beiden Tabellen verbunden werden sollen, ähnlich wie bei Excels VLOOKUP. Im Gegensatz zum Beitritt im SQL-Modus, wo Sie die Spalte in der eingegebenen Syntax diktieren können.

In Chartio kann die Layering-Option zwei unterschiedliche Datenquellen verbinden, entweder aus zwei verschiedenen Amazon Redshift-Verbindungen oder PostgreSQL-Verbindungen oder sogar Google Analytics mit einer Amazon Redshift-Quelle oder einer anderen Art von Datenquelle verbinden und vergleichen. In diesem Beispiel vergleichen wir eine Amazon Redshift-Quelle in Chartio mit einer Google Analytics-Quelle, die wir zur Überwachung von Seitenaufrufsitzungen verwenden. Vergleichen wir also Sitzungen mit Leads aus der Salesforce-Lead-Tabelle.

  • Schritt 1:Erstellen Sie die Abfrage für die Amazon Redshift-Quelle.
    • REDSHIFT - Salesforce-Schicht
      • Tabelle - SF-Lead
      • Spalten
        • Zählung der eindeutigen ID
        • Erstellungstag
        • Erstellungsdatum letzte N Wochen 1

  • Schritt 2:Richten Sie den Verbindungsschritt ein, indem Sie eine neue Ebene hinzufügen.

  • Schritt 3:Erstellen Sie die Abfrage für die Google Analytics-Quelle.
    • GOOGLE ANALYTICS - Chartio-Webanalyse
      • Tabelle - Sitzung
      • Spalten
        • # Sitzungen
        • Tag des Besuchs
        • Zeit Letzte N Wochen 1

  • Schritt 4:Verwenden Sie Data Pipeline Steps, um die resultierende verknüpfte Tabelle
      zu manipulieren
    • Spalte
        hinzufügen
      • Neuer Spaltentyp
        • Leads – laufende Summe
      • Formeltyp
        • Laufende Summe
      • Spalte
          verwenden
        • Anzahl eindeutiger IDs

    • Spalte
        hinzufügen
      • Neuer Spaltentyp
        • Sitzungen – laufende Summe
      • Formeltyp
        • Laufende Summe
      • Mit Spalte
        • Ga:sessions

    • Spalten ausblenden
      • Anzahl eindeutiger IDs
      • Ga:sessions