Als Referenz ist Power BI eine von Microsoft entwickelte Datenvisualisierungs- und Analysesoftware. Power BI kann sowohl für die statische als auch für die interaktive Datenvisualisierung verwendet werden. Bevor Sie tatsächliche Visualisierungen mit Power BI erstellen können, können Sie eine Datenvorverarbeitung mit dem Power BI-Abfrageeditor durchführen.
Mit dem Abfrageeditor können Sie verschiedene Datentransformationsaufgaben ausführen, z. B. Spaltentypen ändern, fehlende Werte handhaben, Zeilen und Spalten löschen, Spalten pivotieren und entpivozieren, Spalten teilen usw.
In diesem Artikel erfahren Sie, wie Sie Spalten mithilfe des Power BI-Abfrageeditors pivotieren, entpivozieren und teilen.
Einen Datensatz in den Abfrageeditor importieren
Der in diesem Artikel als Beispiel verwendete Datensatz liegt im CSV-Dateiformat vor, das über diesen Kaggle-Link heruntergeladen werden kann. Laden Sie die CSV-Datei in Ihr lokales Dateisystem herunter.
Öffnen Sie als Nächstes den Power BI Desktop und klicken Sie im oberen Menü auf die Schaltfläche „Get Data“. Wählen Sie aus der Dropdown-Liste „Text/CSV“ wie unten gezeigt aus.
Power BI wird einige Zeit brauchen, um die Daten zu importieren. Sobald die Daten geladen sind, sollten Sie das folgende Fenster sehen.
Der Datensatz enthält Informationen über Bevölkerung, Fläche, Geburtenrate, Sterberate, Bevölkerungsdichte, BIP pro Kopf, Telefone pro 1000 usw. für alle Länder der Welt. Um die Daten in den Abfrageeditor zu laden, klicken Sie auf die Schaltfläche „Daten transformieren“.
Der Abfrageeditor sieht folgendermaßen aus:
Im Abfrageeditor können Sie verschiedene Vorverarbeitungen durchführen, z. B. Pivotieren, Unpivotieren und Teilen von Spalten.
Pivot- und Unpivoting-Theorie
Bevor wir uns mit dem Pivotieren und Unpivozieren von Spalten mit dem Power BI-Abfrage-Editor befassen. Betrachten wir ein sehr einfaches Beispiel für das Entpivotieren.
Unpivoting
Angenommen, Sie haben einen Datensatz, der die folgenden Informationen enthält. Die Zeilen in der folgenden Tabelle entsprechen Ländern, während die Spalten Informationen über das Pro-Kopf-BIP und die Alphabetisierungsrate für die entsprechenden Länder in Zeilen anzeigen. (Hinweis:Dies sind nur Dummy-Werte, nicht die tatsächlichen Werte)
Land | BIP pro Kopf | Alphabetisierungsrate |
Frankreich | 30.000 | 95 % |
Deutschland | 25.000 | 96 % |
Wenn Sie eine einzelne Spalte entpivotieren, z. B. BIP pro Kopf, sieht der Datensatz mit einer nichtpivotierten Spalte so aus.
Land | Attribut | Wert | Alphabetisierung |
Frankreich | BIP pro Kopf | 30.000 | 95 % |
Deutschland | BIP pro Kopf | 25.000 | 96 % |
Sie können sehen, dass die Spalte BIP pro Kopf durch zwei Spalten ersetzt wurde, nämlich Attribut und Wert. Die Werte in der Spalte „Attribut“ entsprechen dem nichtpivotierten Spaltennamen, während die Spalte „Wert“ die Werte enthält, die zuvor in der nichtpivotierten Spalte vorhanden waren. Da nur eine einzige Spalte unpivotiert ist, sind die Werte in der Spalte „Attribut“ immer gleich. Außerdem bleibt die Anzahl der Zeilen im Datensatz mit einer nichtpivotierten Spalte gleich.
Versuchen wir nun zu sehen, was passiert, wenn wir zwei Spalten entpivotieren. Wir werden sowohl die Spalten „BIP pro Kopf“ als auch „Alphabetisierungsrate“ im ursprünglichen Datensatz entpivozieren. Das Dataset mit zwei nichtpivotierten Spalten sieht so aus.
Land | Attribut | Wert |
Frankreich | BIP pro Kopf | 30.000 |
Frankreich | Alphabetisierungsrate | 95 % |
Deutschland | BIP pro Kopf | 25.000 |
Deutschland | Alphabetisierungsrate | 96 % |
Im obigen Datensatz können Sie sehen, dass die Spalte „Attribut“ für jeden Ländernamen jetzt zwei eindeutige Werte enthält:BIP pro Kopf und Alphabetisierungsrate. Die Spalte „Wert“ enthält die entsprechenden Werte für die Attribute. Beachten Sie, dass sich die Anzahl der Zeilen verdoppelt hat. Wenn Sie die Pivotierung von drei Spalten aufheben, erhöht sich die Anzahl der Zeilen in einem Dataset entsprechend um das Dreifache.
Schwenken
Pivotierung bezieht sich, wie der Name schon sagt, auf den Prozess, der verwendet wird, um einen nicht-pivotierten Datensatz in seine ursprüngliche Form umzukehren. Beim Pivotieren sieht die Eingabetabelle beispielsweise so aus:
Land | Attribut | Wert |
Frankreich | BIP pro Kopf | 30.000 |
Frankreich | Alphabetisierungsrate | 95 % |
Deutschland | BIP pro Kopf | 25.000 |
Deutschland | Alphabetisierungsrate | 96 % |
Nach Anwendung der Pivotierung auf die Spalten „Attribut“ und „Wert“ nimmt der Datensatz die folgende Form an:
Land | BIP pro Kopf | Alphabetisierungsrate |
Frankreich | 30.000 | 95 % |
Deutschland | 25.000 | 96 % |
Nachdem wir nun wissen, was Pivotierung und Unpivoting sind, sehen wir uns an, wie sie mit Power BI implementiert werden.
Pivotieren und Unpivotieren mit Power BI
Sehen wir uns zunächst ein Beispiel an, wie man eine einzelne Spalte mit dem Power BI-Abfrage-Editor entpivotiert. Wenn Sie sich den Datensatz ansehen, enthält er eine Spalte mit dem Namen „Bevölkerung“. Um die Spalte „Bevölkerung“ zu deaktivieren, klicken Sie auf die Spaltenüberschrift und wählen Sie dann die Option „Transformieren“ aus dem oberen Menü. Oben sehen Sie ein neues Menü mit mehreren Optionen. Klicken Sie im Menü auf die Option „Unpivot Columns“ und dann in der Dropdown-Liste auf „Unpivot Columns“, wie unten gezeigt:
Die Spalte „Bevölkerung“ wird durch die Spalten „Attribut“ und „Wert“ ersetzt, wie unten gezeigt:
Um nun eine Spalte zu drehen, haben Sie zwei Möglichkeiten. Sie können im Fenster „Angewandte Schritte“ auf die Option „x Unpivoted Columns“ klicken, wie im folgenden Screenshot gezeigt.
Die andere Möglichkeit besteht darin, eine Spalte auszuwählen und dann „Transform -> Pivot Column“ aus dem oberen Menü auszuwählen, wie unten gezeigt.
Beim Pivotieren einer Spalte müssen Sie die Spalte angeben, die die Werte für die nichtpivotierte Spalte enthält. In unserem Fall enthält die Spalte „Wert“ Werte für die nichtpivotierte Spalte „Attribut“. Sehen Sie sich den folgenden Screenshot als Referenz an.
Die Pivot-Spalte „Bevölkerung“ sieht folgendermaßen aus:
Bewegen Sie die Spalte „Bevölkerung“ direkt neben die Spalte „Bevölkerung“. Dichte (pro Quadratmeile)“ aus, indem Sie auf die Spaltenüberschrift „Bevölkerung“ klicken und ziehen, wie im folgenden Screenshot gezeigt.
Als nächstes entpivotieren wir zwei Spalten, d. h. „Population“ und „Pop. Dichte (pro Quadratmeile)“. Wählen Sie beide Spaltenüberschriften aus und entpivozieren Sie sie dann, wie unten gezeigt:
Nach dem Entpivotieren sollten Sie die folgenden zwei Spalten sehen, die im Dataset erstellt wurden. Sie können sehen, dass die Spalte „Attribute“ jetzt Informationen zu „Population“ und „Pop“ enthält. Dichte (pro Quadratmeile)“.
Wählen Sie beide Spaltenüberschriften aus (STRG + Klicken) und ziehen Sie dann die Spalten direkt neben die Spalte „Land“, wie unten gezeigt.
Jetzt können Sie „Ländernamen“, ihre Gesamtbevölkerung und Bevölkerungsdichte pro Quadratmeile sehen. Lassen Sie uns den Namen der Spalte „Attribut“ in „Bevölkerungstyp“ ändern, da die Spalte „Attribut“ zwei Bevölkerungstypen anzeigt:die Gesamtbevölkerung und die Bevölkerungsdichte pro Quadratmeile. Der Datensatz mit einem aktualisierten Spaltenkopfnamen sieht folgendermaßen aus:
Spalten teilen
Bevor wir die Spalten aufteilen, werden wir einige Werte in der Spalte „Bevölkerungstyp“ ersetzen.
Der Wert „Bevölkerung“ in der Spalte „Bevölkerungstyp“ bezieht sich auf die Gesamtbevölkerung. Wir werden den Wert „Population“ durch „Pop“ ersetzen. Total“, sodass es das gleiche Muster wie „Pop. Dichte (pro Quadratmeile)“. Um Werte in Spalten zu ersetzen, gehen Sie zu „Transform -> Replace Values“, wie im folgenden Screenshot gezeigt.
Nach dem Ersetzen der Werte sieht der Datensatz so aus.
Jetzt teilen wir die Spalte „Bevölkerungstyp“ in zwei Teile. Die ersten fünf Zeichen werden der ersten Spalte hinzugefügt, während die restlichen Zeichen der anderen Spalte hinzugefügt werden. Um eine Spalte zu teilen, gehen Sie zu „Transform -> Split Columns“. Wir werden nach den ersten fünf Zeichen aufteilen, wählen Sie daher die Option „Nach Anzahl der Zeichen aufteilen“ aus der Dropdown-Liste. Wir werden die Spalte durch die ersten 5 Zeichen ganz links teilen. Als Referenz sehen Sie sich den folgenden Screenshot an.
Sobald die Spalten geteilt sind, sollten Sie die folgenden beiden Spalten sehen.
Wir benötigen nur die Spalte „Bevölkerungstyp.2“, da sie Informationen über die Art oder den Umfang der Bevölkerung enthält. Klicken Sie auf die Spalte „Bevölkerungstyp.1“ und wählen Sie dann „Löschen“.
Abschließend können Sie die Spalte „Bevölkerungstyp.2“ wie unten gezeigt in „Bevölkerungstyp“ umbenennen.
Aus der folgenden Abbildung können Sie ersehen, dass es für jedes Land zwei verschiedene Arten von Bevölkerungswerten gibt. Der Wert „Total“ in der Spalte „Population Type“ bezieht sich auf die Gesamtbevölkerung des Landes. Der tatsächliche Wert für die Gesamtbevölkerung wird in der Spalte „Bevölkerungswert“ gespeichert. Ebenso zeigt der Wert „Dichte (pro Quadratkilometer)“, dass sich dieser Bevölkerungswert auf die Bevölkerungsdichte bezieht.
Schlussfolgerung
Zusammenfassend zeigt Ihnen der Artikel, wie Sie das Pivotieren und Unpivotieren im Power BI-Abfrage-Editor durchführen. Darüber hinaus wird die grundlegende Theorie hinter schwenkbaren und nicht schwenkbaren Säulen behandelt, die durch anschauliche Beispiele veranschaulicht wird. Abschließend erklärt der Artikel, wie der Vorgang des Aufteilens von Spalten im Power BI-Abfrage-Editor implementiert wird.