Was sind Power BI Dataflows?

Veröffentlicht am 28.09.2021 | Lesezeit 5 Min.

 

Power BI Dataflows sind eine Self-Service Datenaufbereitung, welche direkt im Power BI Dienst also in der Cloud erstellt werden können. Die Idee hinter dieser Möglichkeit ist wiederkehrende Datentransformationslogiken für alle Berichtsentwickler bereitzustellen.

Was können Power BI Dataflows?

Mit Power BI Dataflows kann eine Verbindung zu verschiedenen Datenquellen durch die in Power BI vorhandenen Konnektoren aufgebaut werden. Ferner besteht die Möglichkeit sogenannte ETL-Prozesse (Extract, Transform & Load) damit auch ohne Programmierkenntnisse zu implementieren, was die Power BI Dataflows im weiten Sinne zu einem übergreifenden no code/low code ETL macht. Von Vorteil sind lediglich Kenntnisse mit Power Query (eine Transformationsengine in Power BI oder Excel). Im Grunde ist die Entwicklung eines Power BI Dataflows dasselbe wie Power Query, nur eben in der Cloud. 

Wie werden die Daten gespeichert?

Technisch werden im Hintergrund die Daten eines Power BI Dataflows in einem sogenannten Azure Data Lake Storage gen 2 gespeichert. Hier gilt für die Speicherung entweder „bring your own Azure“. Wer keinen eigenen zur Verfügung hat, bekommt schon mit einer Power BI Pro Lizenz eine „Data Lake Storage gen 2“ Kapazität zur Verfügung gestellt und das ohne große Einstellungen zu tätigen.

Dataflows in Anwendung

Wo findet der Anwender den Power BI Dataflow?

Ist ein Dataflow erstellt, wird dieser in einem Power BI Arbeitsbereich gespeichert. Das bedeutet, dass der Power BI Dataflow Entwickler sich nicht um die technische Speicherung im Azure Data Lake Storage gen 2 kümmern muss, da dieser Schritt vom Power BI Dienst mit der Anlage eines Datflows automatisch übernommen wird. Die Daten aus dem abgespeicherten Power BI Dataflow kann ein Berichtsentwickler wie gewohnt durch die Verwendung eines dafür bereitgestellten Berichtskonnektor im Power BI Desktop Client erhalten. 

Sind Datentransformationslogiken im Bericht noch nötig?

Diese Frage kann man nur nach eingehender Analyse beantworten. Es lassen sich aber einige Vorteile erwähnen. Der Power BI Dataflow ist für eine hohe Anzahl an Abfragen konzipiert, macht jedoch selbst nur in definierten Zeiträumen eine Anfrage auf eine meist dahinterliegenden Produktivdatenbanken, die eher für die Datenintegration und Datenhaltung konzipiert ist. Heißt im Umkehrschluss, dass die dahinterliegende Datenbank mit einem Power BI Dataflow weniger belastet wird, da nur der Power BI Dataflow die Abfrage tätig und nicht mehr die einzelnen den Berichten zugrundeliegenden DataSets (Datenset eines jeden Berichts) mit eigenen Verbindungen zu einer Datenbank. Viele Abfragen auf den Dataflow von mehreren Berichten sind hingegen kein Problem.

Hat ein Mitarbeiter wichtige Transformationsschritte auf Basis der Daten getätigt, können diese über den Power BI Dataflow für die Allgemeinheit veröffentlicht werden. Die Allgemeinheit profitiert also vom Wissen und bereits getätgter Arbeit mit der Erstellung eines Dataflows eines jeden Einzelnen.

 

Eine weitere Möglichkeit ist neben der Datenbeschaffung die zusätzliche Trennung von Datenaufbereitung und der eigentlichen Berichtsentwicklung. Statt sich mit Power Query und der zugrundeliegenden M Language auseinander zu setzen, kann sich der typische Berichtsentwickler bzw. Analyst mit Power BI mehr auf die Datenmodellierung, mit der aus der Excel-Welt bekannten DAX (Data Analyis Expressions) Sprache sowie auf die Datenvisualisierung konzentrieren. 

Sie haben Fragen zu der Thematik und wollen mit SOLVIN in Kontakt treten? 

 

 

Lesen Sie mehr
über Objectives & Key Results

 

 

 

Mit Objectives and Key Results (OKR) das Bewusstsein für die Strategie schaffen

 

Kommentar hinterlassen