Mit Power BI Desktop können Sie Verbindungen zu vielen unterschiedlichen Arten von Datenquellen herstellen und anschließend die Daten nach Ihren Anforderungen strukturieren. Das Strukturieren von Daten ist mit einem Transformieren der Daten gleichzusetzen. So müssen beispielsweise Spalten oder Tabellen umbenannt, Text in Zahlen umgewandelt, Zeilen entfernt oder die erste Zeile als Überschrift festgelegt werden. Als Kombinieren von Daten werden das Verbinden von mehreren Datenquellen, das auf die Anforderungen ausgerichtete Strukturieren der Daten und schließlich das Konsolidieren in eine praktische Abfrage bezeichnet.

In diesem Dokument wird veranschaulicht, wie Sie eine Abfrage mit Power BI Desktop strukturieren. Besonders hervorgehoben werden einige der dabei am häufigsten auszuführenden Aufgaben. Die hier verwendete Abfrage (und auch der gesamte Erstellungsvorgang) ist im Handbuch Erste Schritte mit Power BI-Desktop ausführlicher beschrieben.

Es ist wichtig zu wissen, dass im Abfrage-Editor von Power BI Desktop neben den im Menüband verfügbaren Optionen häufig Kontextmenüs (Rechtsklick) zum Einsatz kommen. Die meisten Optionen, die im Menüband Transformieren zur Auswahl stehen, können auch über Klicken auf ein Element (z. B. eine Spalte) mit der rechten Maustaste und Auswählen aus dem Kontextmenü aufgerufen werden.

Strukturieren von Daten

Wenn Sie im Abfrage-Editor Daten strukturieren, geben Sie schrittweise Anweisungen vor (die der Abfrage-Editor dann für Sie ausführt), um die Daten beim Laden und Darstellen im Abfrage-Editor anzupassen. Die ursprüngliche Datenquelle wird davon nicht berührt. Angepasst bzw. strukturiert wird nur diese spezifische Ansicht der Daten.

Die Schritte, die Sie angeben (z. B. Umbenennen einer Tabelle, Transformieren eines Datentyps oder Löschen von Spalten), werden vom Abfrage-Editor aufgezeichnet und bei jeder Verbindung zu dieser Datenquelle ausgeführt, sodass die Daten stets in der gewünschten Art "strukturiert" sind. Dieser Vorgang erfolgt jedes Mal, wenn Sie den Abfrage-Editor in Power BI Desktop verwenden, aber auch jedes Mal, wenn jemand auf die freigegebene Abfrage zugreift, z. B. im Power BI-Dienst. Diese Schritte werden der Reihe nach im Bereich Abfrageeinstellungen unter Angewendete Schritte aufgezeichnet.

Die folgende Abbildung zeigt den Bereich Abfrageeinstellungen für eine strukturierte Abfrage. In den nächsten Abschnitten werden die Schritte im Einzelnen erläutert.

Wir verwenden wieder die Daten zu den bevorzugten Wohnorten für Pensionäre aus dem Handbuch Erste Schritte mit Power BI Desktop, die wir über die Verbindung mit einer Webdatenquelle gefunden haben. Wir werden die Daten so strukturieren, dass sie unseren Anforderungen entsprechen.

Zunächst sehen wir, dass die Werte in einer Spalte beim Laden der Tabelle vom Abfrage-Editor nicht automatisch von Text in Zahlen transformiert wurden. Wir benötigen aber Zahlen. Kein Problem: Klicken Sie einfach mit der rechten Maustaste auf die Spaltenüberschrift, und wählen Sie Typ ändern > Ganze Zahl aus, um die Werte zu ändern. Um mehr als eine Spalte auszuwählen, wählen Sie zuerst eine Spalte aus, drücken Sie die UMSCHALTTASTE, und wählen Sie dann mit gedrückter Taste weitere angrenzende Spalten aus. Klicken Sie anschließend mit der rechten Maustaste auf eine Spaltenüberschrift, um alle ausgewählten Spalten zu ändern. Sie können auch die STRG-TASTE verwenden, um nicht angrenzende Spalten auszuwählen.

Sie können im Menüband Transformieren auch Spalten von Text in Überschriften transformieren. Die Abbildung zeigt das Menüband Transformieren. Der Pfeil weist auf die Schaltfläche Datentyp, mit der Sie den aktuellen Datentyp in einen anderen Typ transformieren können.

Im Bereich Abfrageeinstellungen sehen Sie, dass unter Angewendete Schritte alle Schritte zum Strukturieren der Daten aufgeführt sind. Wenn Sie einen Schritt aus dem Strukturierungsprozess entfernen möchten, wählen Sie einfach das X links neben dem jeweiligen Schritt aus. In der folgenden Abbildung werden unter Angewendete Schritte die bisher ausgeführten Schritte aufgelistet: Herstellen einer Verbindung zur Website (Quelle), Auswahl der Tabelle (Navigation) und die automatische Konvertierung von textbasierten Zahlenspalten von Text in Ganze Zahl (Geänderter Typ) durch den Abfrage-Editor beim Laden der Tabelle. Eine Spalte mit Bewertungen wurde jedoch nicht automatisch in einen zahlenbasierten Typ geändert. Warum das so ist, werden wir in den nächsten Abschnitten feststellen.

Bevor wir mit dieser Abfrage arbeiten können, müssen wir ein paar Änderungen vornehmen, um die Daten nach unseren Anforderungen zu ordnen:

  • Entfernen der ersten Spalte: Diese Spalte brauchen wir nicht. Sie enthält nur überflüssige Zeilen mit dem Text „Check out how your state ranks for retirement“, ein Artefakt aufgrund der Tatsache, dass es sich bei dieser Datenquelle um eine webbasierte Tabelle handelt.

  • Beheben von Fehlern: In einer Spalte, Health care quality gibt es bei den Bewertungen der Bundesstaaten einige Male einen Gleichstand. Auf der Website waren diese mit dem Text (tie) nach den Zahlen versehen. Das funktioniert gut auf der Website, stellt uns aber vor die Aufgabe, diese Spalte manuell von Text in Daten konvertieren zu müssen. Dieses Problem ist in Power BI Desktop ganz einfach zu beheben und veranschaulicht ein nützliches Feature der Abfrage im Bereich Angewendete Schritte.

  • Ändern des Tabellennamens: Table 0 ist kein sinnvoller Deskriptor, er kann aber sehr einfach geändert werden.

Um die erste Spalte zu entfernen, wählen Sie zuerst die Spalte und dann im Menüband die Registerkarte Start aus. Klicken Sie anschließend auf Spalten entfernen, wie in der folgenden Abbildung gezeigt.

Als Nächstes nehmen wir uns die Textspalte vor und transformieren sie in Zahlen. Zunächst erscheint es ganz einfach, den Typ der Spalte Health care quality von Text in Zahlen (z. B. Ganze Zahl oder Dezimalzahl) zu ändern. Wenn wir jedoch den Typ von Text in Ganze Zahl ändern und dann die Werte in dieser Spalte betrachten, stellen wir fest, dass die Abfrage Fehler meldet.

Es gibt verschiedene Möglichkeiten, weitere Informationen zu den einzelnen Fehlern zu erhalten. Sie können entweder die Zelle auswählen (ohne auf das Wort Fehlerzu klicken) oder direkt auf das Wort Fehler klicken. Wenn Sie die Zelle ohne Klicken auf das Wort Fehlerauswählen, zeigt der Abfrage-Editor die Fehlerinformationen unten im Fenster an.

Wenn Sie direkt auf das Wort Fehler klicken, erstellt die Abfrage im Bereich Abfrageeinstellungen unter Angewendete Schritte einen weiteren Schritt und zeigt die Informationen zu dem Fehler an.

Um wieder zur Abfrage zu gelangen, müssen Sie diesen Schritt entfernen, indem Sie auf das zugehörige X klicken.

Wenn Sie unter Angewendete Schritteden letzten Schritt auswählen, wird der eben beschriebene Fehler angezeigt, wie aus der folgenden Abbildung hervorgeht.

Da die Abfrage die Schritte nacheinander aufzeichnet, können wir unter Angewendete Schritteden Schritt vor der Typänderung auswählen und den Wert dieser Zelle vor der Transformation anzeigen (siehe Abbildung).

Nun können wir diese Werte korrigieren und danach den Typ ändern. Der Abfrage-Editor zeichnet die Schritte zwar nacheinander, aber unabhängig voneinander auf. Daher können Sie unter Angewendete Schritte die Schritte in der Reihenfolge nach oben oder unten verschieben. Klicken Sie einfach mit der rechten Maustaste auf einen Schritt, und der Abfrage-Editor stellt ein Kontextmenü mit folgenden Optionen bereit: Umbenennen, Löschen, Bis zum Ende löschen (entfernt den aktuellen und alle nachfolgenden Schritte) Nach oben oder Nach unten.

Außerdem können Sie unter Angewendete Schritte einen beliebigen Schritt in der Liste auswählen und die Strukturierung der Daten an diesem Punkt der Reihenfolge fortsetzen. Der Abfrage-Editor fügt unter Angewendete Schrittenach dem aktuell ausgewählten Schritt automatisch einen neuen Schritt ein. Probieren wir es aus.

Zunächst wählen wir unter Angewendete Schritte den Schritt vor der Änderung des Typs der Spalte Health care quality aus. Dann ersetzten wir die Werte, die in der Zelle mit dem Text "(tie)" versehen sind so, dass nur noch die Zahlen erhalten bleiben. Klicken Sie mit der rechten Maustaste auf die Zelle mit dem Inhalt "35 (tie)", und wählen Sie Werte ersetzen... im angezeigten Kontextmenü aus. Achten Sie darauf, welcher Schritt unter Angewendete Schritte aktuell ausgewählt ist (der Schritt vor der Typänderung).

Da wir einen Schritt einfügen, warnt uns der Abfrage-Editor vor möglichen Konsequenzen - die nachfolgenden Schritte könnten u.U. beeinträchtigt und die Abfrage unbrauchbar werden. Wir müssen sorgfältig und mit Bedacht vorgehen! Da dies ein Tutorial ist und wir ein wirklich nützliches Feature der Abfrage zum Erstellen, Löschen, Einfügen und Neuordnen von Schritten veranschaulichen möchten, fahren wir fort und wählen Einfügen aus.

Dreimal ist eine Zahl mit dem Text "(tie)" versehen. Daher ersetzen wir alle drei Werte. Wenn Sie einen neuen angewendeten Schritt erstellen, benennt ihn der Abfrage-Editor nach der jeweiligen Aktion, in diesem Fall Ersetzter Wert. Wenn die Abfrage mehrere Schritte gleichen Namens enthält, versieht der Abfrage-Editor unter Angewendete Schritte jeden Folgeschritt zur Unterscheidung mit einer Nummer in der entsprechenden Reihenfolge.

In der folgenden Abbildung sehen Sie in den Abfrageeinstellungen die drei Schritte Ersetzter Wert, aber noch etwas viel Interessanteres: Da wir alle Instanzen des Texts "(tie)" aus der Spalte Health care quality entfernt haben, wird der Schritt Geänderter Typ jetzt ohne Fehler ausgeführt.

Hinweis: Sie können auch die Option Fehler entfernen (im Menüband oder Kontextmenü) verwenden, mit der fehlerhafte Zeilen entfernt werden. In diesem Fall würden damit alle Bundesstaaten aus den Daten entfernt, deren Zahlen mit dem Text (tie) versehen sind. Das möchten wir aber nicht, sondern wir möchten alle Bundesstaaten in der Tabelle behalten.

Zugegeben, das war jetzt ein bisschen kompliziert, aber ein gutes Beispiel für die leistungsfähigen und vielseitigen Abfragefunktionen.

Zum Schluss möchten wir noch den Namen der Tabelle in einen aussagekräftigeren Namen ändern. Bei der späteren Erstellung von Berichten sind aussagekräftige Tabellennamen besonders wichtig, gerade wenn Sie Verbindungen zu mehreren Datenquellen herstellen und alle im Bereich Felder der Berichtsansicht aufgelistet sind.

Das Ändern des Tabellennamen ist einfach: Geben Sie im Bereich Abfrageeinstellungen unter Eigenschafteneinfach den neuen Namen der Tabelle ein (siehe Abbildung), und drücken Sie dann die EINGABETASTE. Wir nennen diese Tabelle RetirementStats.

Die Daten sind nun soweit strukturiert, dass sie unseren Anforderungen entsprechen. Jetzt stellen wir eine Verbindung zu einer anderen Datenquelle her und kombinieren die Daten.

Kombinieren von Daten

Diese Daten von verschiedenen Bundesstaaten sind interessant und nützlich zur Erstellung weiterer Analysen und Abfragen. Es gibt allerdings ein Problem: Bei den meisten Daten wird ein zweistelliges Länderkürzel als Code für den Bundesstaat und nicht dessen voller Name verwendet. Wir müssen die Namen der Bundesstaaten in irgendeiner Weise mit den Kürzeln verknüpfen.

Glücklicherweise gibt es eine andere öffentliche Datenquelle, die genau das bereitstellt. Die Daten müssen jedoch noch entsprechend strukturiert werden, bevor wir sie mit unserer Tabelle mit bevorzugten Wohnorten für Pensionäre verbinden können. Hier befindet sich die Webressource mit den Länderkürzeln:

http://en.wikipedia.org/wiki/List_of_U.S._state_abbreviations

Wählen Sie im Abfrage-Editor im Menüband auf der Registerkarte Start die Optionen Neue Quelle > Web aus. Geben Sie die Adresse ein, und klicken Sie auf „OK“. Im Navigator werden die Ergebnisse von dieser Webseite angezeigt.

Wählen Sie Table[edit] aus, da diese Tabelle die gewünschten Daten enthält. Sie muss aber noch strukturiert werden, damit diese Tabelle nur noch die gewünschten Daten enthält.

Tipp: Gibt es einen schnelleren oder einfacheren Weg, die nachstehenden Schritte auszuführen? Ja, Sie könnten eine Beziehung zwischen den beiden Tabellen erstellen und die Daten basierend auf dieser Beziehung strukturieren. Die folgenden Schritte sind immer noch hilfreich beim Lernen der Arbeit mit Tabellen. Nehmen Sie jedoch zur Kenntnis, dass Beziehungen dabei helfen können, Daten aus mehreren Tabellen schnell zu verwenden.

Befolgen Sie die folgenden Schritte, um diese Daten zu strukturieren:

  • Entfernen Sie die beiden oberen Zeilen. Sie sind auf die Erstellungsweise der Webseitentabelle zurückzuführen und werden nicht gebraucht. Wählen Sie im Menüband auf der Registerkarte Start die Optionen Zeilen verringern > Zeilen entfernen > Erste Zeilen entfernen aus.

Das Fenster Erste Zeilen entfernen wird angezeigt, in dem Sie angeben können, wie viele Zeilen Sie entfernen möchten.

  • Entfernen Sie die letzten 26 Zeilen. Hierbei handelt es sich um Gebiete, die wir nicht brauchen. Wählen Sie im Menüband auf der Registerkarte Start die Optionen Zeilen verringern > Zeilen entfernen > Letzte Zeilen entfernen aus.

  • Da die Tabelle „RetirementStats“ keine Informationen für Washington, D.C., enthält, müssen wir Washington, D.C., aus der Liste herausfiltern. Wählen Sie den Dropdownpfeil neben der Spalte „Region Status“ aus, und deaktivieren Sie das Kontrollkästchen neben Federal District.

  • Entfernen Sie ein paar überflüssige Spalten. Wir benötigen nur die Zuordnung der Bundesstaaten zu den offiziellen zweistelligen Länderkürzeln. Daher können wir die folgenden Spalten entfernen: Column2, Column3 sowie Column5 bis Column10. Wählen Sie zuerst Column2 aus, und wählen Sie dann mit gedrückter STRG-TASTE die übrigen zu entfernenden Spalten aus (mit STRG können Sie mehrere, nicht angrenzende Spalten auswählen). Wählen Sie im Menüband auf der Registerkarte „Start“ die Optionen Spalten entfernen > Spalten entfernen aus.

  • Verwenden Sie die erste Zeile als Überschrift. Da wir die oberen drei Zeilen entfernt haben, ist die aktuelle oberste Zeile die benötigte Überschrift. Sie können Erste Zeile als Überschriften verwenden im Menüband entweder auf der Registerkarte Start oder auf der Registerkarte Transformieren auswählen.

Hinweis: An dieser Stelle sei darauf hingewiesen, dass die Reihenfolge der im Abfrage-Editor angewendeten Schritte wichtig ist und sich auf die Strukturierung der Daten auswirken kann. Berücksichtigt werden muss auch, wie sich ein Schritt auf einen anderen, nachfolgenden Schritt auswirkt. Wenn Sie also aus "Angewendete Schritte" einen Schritt entfernen, verhalten sich die nachfolgenden Schritte aufgrund des Einflusses der Schrittreihenfolge der Abfrage möglicherweise nicht mehr so, wie es ursprünglich beabsichtigt war.

Ein weiterer Hinweis: Wenn Sie die Größe des Abfrage-Editorfensters verändern, es schmaler machen, werden einige Elemente des Menübands gestaucht, um den angezeigten Raum optimal zu nutzen. Wenn Sie das Fenster des Abfrage-Editors verbreitern, werden die Elemente des Menübands gedehnt, um die größere Fläche des Menübands zu nutzen.

  • Benennen Sie die Spalten und die eigentliche Tabelle um. Wie üblich gibt es mehrere Möglichkeiten, eine Spalte umzubenennen: Wählen Sie zuerst die Spalte und dann im Menüband auf der Registerkarte Transformieren die Option Umbenennen aus, oder klicken Sie mit der rechten Maustaste, und wählen Sie im Kontextmenü die Option Umbenennen aus. In der folgenden Abbildung weisen Pfeile auf diese beiden Optionen; sie brauchen nur eine davon auszuwählen.

Wir benennen die Spalten in State Name und State Code um. Um die Tabelle umzubenennen, geben Sie im Bereich Abfrageeinstellungen den Namen einfach im Feld Name ein. Diese Tabelle nennen wir StateCodes.

Nachdem wir nun die Tabelle „StateCodes“ wie gewünscht strukturiert haben, können wir die beiden Tabellen bzw. Abfragen kombinieren. Da die Tabellen, die wir jetzt haben, die Ergebnisse der Abfragen sind, die wir auf die Daten angewendet haben, werden sie häufig auch als Abfragen bezeichnet.

Zum Kombinieren von Daten gibt zwei bevorzugte Möglichkeiten: Zusammenführen und Anhängen.

Wenn eine oder mehrere Spalten zu einer anderen Abfrage hinzugefügt werden sollen, werden die Abfragen zusammengeführt . Wenn einer vorhandenen Abfrage zusätzliche Datenzeilen hinzugefügt werden sollen, wird die Abfrage angehangen .

Im vorliegenden Fall werden wir die Abfragen zusammenführen. Wählen Sie zunächst im linken Bereich des Abfrage-Editors die Abfrage aus, mit der die andere Abfrage zusammengeführt werden soll, in diesem Fall RetirementStats. Anschließend wählen Sie im Menüband auf der Registerkarte Start> die Optionen Kombinieren Abfragen zusammenführen aus.

Möglicherweise werden Sie aufgefordert, die Sicherheitsstufen festzulegen, um sicherzustellen, dass die Daten kombiniert werden, ohne Daten mit einzuschließen oder zu übertragen, die Sie nicht einschließen oder übertragen möchten.

Im Fenster Zusammenführen werden Sie aufgefordert, die Tabelle auszuwählen, die mit der ausgewählten Tabelle zusammengeführt werden soll. Anschließend müssen Sie die Spalten angeben, die für die Zusammenführung verwendet werden sollen. Wählen Sie „State“ in der Tabelle (Abfrage) RetirementStats und dann die Abfrage StateCodes aus. (Das ist in diesem Fall recht einfach, da es nur eine andere Abfrage gibt. Wenn Sie Verbindungen zu vielen Datenquellen herstellen, stehen hier viele Abfragen zur Auswahl.) Wenn Sie die übereinstimmenden Spalten – State aus RetirementStats und State Name aus StateCodes – richtig auswählen, sieht das Fenster Zusammenführen wie folgt aus, und die Schaltfläche OK ist aktiviert.

Am Ende der Abfrage wird eine neue Spalte namens NewColumn erstellt, die den Inhalt der Tabelle (Abfrage) enthält, die mit der vorhandenen Abfrage zusammengeführt wurde. Alle Spalten der zusammengeführten Abfrage werden auf die neue Spalte NewColumn reduziert. Sie können jedoch die Tabelle erweitern und die gewünschten Spalten einbeziehen.

Um die zusammengeführte Tabelle zu erweitern und auszuwählen, welche Spalten einbezogen werden sollen, klicken Sie auf das Erweiterungssymbol (Erweitern ). Das Fenster Erweitern wird geöffnet.

In unserem Fall benötigen wir nur die Spalte State Code. Daher wählen Sie nur diese Spalte aus und klicken dann auf OK. Deaktivieren Sie das Kontrollkästchen „Ursprünglichen Spaltennamen als Präfix verwenden“, da wir den ursprünglichen Spaltennamen nicht benötigen. Wenn das Kontrollkästchen aktiviert bleibt, erhält die zusammengeführte Spalte den Namen NewColumn.State Code (zusammengesetzt aus dem ursprünglichen Spaltennamen bzw. NewColumn, einem Punkt und dem Namen der in die Abfrage eingefügten Spalte).

Hinweis: Möchten Sie ein wenig mit dem Einfügen der Tabelle NewColumn experimentieren? Sie können ein wenig ausprobieren. Wenn Ihnen die Ergebnisse nicht gefallen, löschen Sie diesen Schritt einfach in der Liste Angewendete Schritte im Bereich Abfrageeinstellungen. Ihre Abfrage wird dann wieder in den Zustand vor Anwenden des Schritts Erweitern versetzt. Auf diese Weise können Sie beliebig oft und solange experimentieren, bis die Erweiterung Ihren Vorstellungen entspricht.

Wir haben jetzt eine einzelne Abfrage (Tabelle), in der zwei entsprechend den Anforderungen strukturierte Datenquellen miteinander kombiniert sind. Diese Abfrage kann als Grundlage für viele weitere interessante Datenverbindungen dienen, z. B. für Statistiken zu Wohnkosten, demografischen Daten oder Beschäftigungsmöglichkeiten in den einzelnen Bundesstaaten.

Um die Änderungen zu übernehmen und den Abfrage-Editor zu schließen, wählen Sie im Menüband auf der Registerkarte Start die Option „Schließen und Anwenden“ aus. Das transformierte Dataset wird in Power BI Desktop angezeigt und kann zum Erstellen von Berichten verwendet werden.

Weitere Informationen

Mit Power BI Desktop können Sie viele Aufgaben ausführen. Weitere Informationen zu den Funktionen und Möglichkeiten finden Sie in folgenden Ressourcen: