Microsoft Fabric - Booste deine Datenanalyse
Was du jetzt über die neue SaaS-Plattform Fabric wissen musst
Microsoft Fabric mischt die Branche ordentlich auf. Microsoft-Chef Satya Nadella bezeichnet den neuesten Coup seines Unternehmen als “the biggest launch of a data product from Microsoft since the launch of SQL Server". Damit übertreibt er nicht. Wir erklären dir, warum Microsoft Fabric auch deine tägliche Datenanalyse für immer verändern wird.
Denn egal, ob du Data Engineer, Data Analyst, Data Scientist bist oder zu den Business-Usern zählst: Microsoft Fabric bringt dich, dein Data Team und sämtliche Mitarbeitenden in deinem Unternehmen noch näher zusammen, wenn ihr mit euren Daten arbeitet. Das Stichwort lautet Kollaboration. Denn es war tatsächlich noch nie so simpel, sämtliche Daten an einem einzigen Ort, also einer Single-Source-of-Truth, zu versammeln und einen einfachen, vor allem intuitiven, Zugriff auf diese zu erhalten. Dieser Artikel klärt deine wichtigsten Fragen zu Microsoft Fabric und verschafft dir einen soliden ersten Überblick über mögliche Anwendungsbereiche.
Was genau ist eigentlich Microsoft Fabric?
In der offiziellen Dokumentation heißt es: "Microsoft Fabric ist eine All-in-One-Analyselösung für Unternehmen, die alles von der Datenbewegung bis hin zu Data Science, Echtzeit-Analysen und Business Intelligence abdeckt." Alle Daten- und Analyseprodukte sind in einem Produkt und einem Data Lake vereint: OneLake. Fabric wird als SaaS-Dienst für alle Arten von Daten-, Analyse- und BI-Funktionen implementiert, darunter: Datenintegration, Business Intelligence, Synapse-Datentechnik, Data Warehousing, Data Science und Real-time Analytics. Die Plattform bietet umfassende Analysefunktionen, die für die nahtlose Zusammenarbeit entwickelt wurden. Jede Anwendung ist auf eine bestimmte Persona und eine bestimmte Aufgabe zugeschnitten.
Warum mischt Microsoft Fabric die Branche auf?
Obwohl sich Microsoft Fabric noch in der Preview befindet und voraussichtlich im Juli dann offiziell gelauncht wird, ist die Begeisterung in der Branche jetzt schon weitreichend spürbar. Die gesamte Data Journey, von der Sammlung und Speicherung der Daten über die Transformation bis hin zur Analyse geschieht auf einer einzigen SaaS-Plattform und auf Basis eines neuen Data Lakes namens OneLake. Sämtliche User und Userinnen arbeiten auf derselben Datenbasis und speichern ihre Datenstände als Parquet-Delta-Dateien, nutzen dieselben Daten also unabhängig voneinander für ihre eigenen Aufgaben in der Data Journey, ob Data Engineer, Data Analyst oder Consumer der Berichte. Die Anwendung ist intuitiv. Sämtliche Mitarbeitende eines Unternehmens können hier nicht nur involviert werden, sondern kollaborativ zusammenarbeiten – ohne technische Hürden, ohne organisatorische Trennlinien. Das gab es in dieser Form noch nicht.
Auf welcher Grundlage baut Microsoft Fabric auf?
Azure Synapse und Power BI rücken in Microsoft Fabric noch näher zusammen. User von Power BI werden sich in Fabric schnell eingewöhnen. Denn die SaaS-Grundlage, auf der Fabric aufbaut, ist der Power BI-Dienst. Fabric-Arbeitsbereiche verhalten sich wie Power BI-Arbeitsbereiche, aber mit mehr verfügbaren Elementtypen. Die Navigation funktioniert genauso, wie in Power BI. Mit Fabric-Elementen und Fabric-Arbeitsbereichen können Nutzende genauso zusammenarbeiten und sie gemeinsam verwenden wie mit Power BI. Neue Fabric-Workloads benutzen das kapazitätsbasierte Berechnungsmodell von Power BI Premium. Auch die Fabric-Verwaltung funktioniert wie die Power BI-Verwaltung. Das Fabric-Verwaltungsportal ist die Weiterentwicklung des Power BI-Verwaltungsportals.
Die neuen Fabric-Workloads sind im Grunde genommen die Aktualisierung und Verbesserung bestehender Azure-Datendienste. Dazu gehören die etablierten PaaS-Dienste Azure Synapse, Azure Data Factory und Azure Data Explorer. Sie alle laufen nun auf der gemeinsamen SaaS-Basis von Fabric. User und Userinnen, die bereits mit diesen Diensten vertraut sind, werden mit den neuen Funktionen in Fabric sofort gut klar kommen. Die Arbeit mit Pipelines und Notebooks oder SQL- und KQL-Abfragen schreiben, funktioniert in Fabric genauso, nur in neuem Kontext.
Was ist OneLake?
OneLake ist ein einzelner, einheitlicher, logischer Data Lake für die gesamte Organisation. Er erinnert an OneDrive. Auch OneLake wird automatisch mit jedem Microsoft Fabric-Mandanten bereitgestellt und ist so konzipiert, dass er der einzige Ort für alle Analysedaten eines Unternehmens ist. Wo Daten vorher vielleicht über verschiedene Services und mithilfe separater Analyse-Tools hin und her bewegt wurden, liegen sie in Fabric allesamt in OneLake. OneLake ist sozusagen das Herz von Fabric.
OneLake ist auf ADLS Gen2 aufgebaut. User und Userinnen können jeden Dateityp speichern und dieselben APIs verwenden, die sie für die Verbindung mit ADLS Gen2 benutzen. Alle Daten können jederzeit dort verwendet werden, wo und in welcher Form sie benötigt werden. Die Daten werden nur einmal aufgenommen und gespeichert. Anwendende greifen also auf die zentralen Daten zu, bearbeiten sie beispielsweise im Warehouse mit SQL oder analysieren sie als Tabellendatensatz in Power BI, während die Veränderungen an den Daten in der weiteren Verarbeitung als separate Parquet-Delta-Dateien gespeichert werden. Storage und Compute sind getrennt - ein riesiger Pluspunkt für Microsoft Fabric, da damit die Geschwindigkeit in der Weiterverarbeitung enorm gesteigert wird und die Handhabung großer Datensätze um ein Vielfaches vereinfacht wird, insbesondere, wenn wir an die Verarbeitung von Real-time-Daten denken.
Kann ich Microsoft Fabric für KI-Anwendungen nutzen?
Fabric ist vollumfänglich mit dem Azure OpenAI Service verbunden. Mit Copilot verwenden User und Userinnen ihre natürliche Sprache, erstellen damit Datenflüsse und Daten-Pipelines, Code oder generieren sogar ganze Funktionen. Auch KI-Modelle lassen sich hier erstellen oder Ergebnisse visualisieren.
Wer kann mit Microsoft Fabric arbeiten?
Alle. Data Scientists, Data Engineers, BI Experts, Business User und Userinnen, du und ich. Bislang arbeitet jeder User und jede Userin mit seinen und ihren eigenen Tools und Kenntnissen, mit jeweils eigenen Stärken und Schwächen. Damit erforderten die meisten Projekte einen erheblichen Integrationsaufwand, damit der Output der jeweiligen Tools und die Verknüpfung der Ergebnisse untereinander in der gesamten Wertschöpfungskette funktioniert. Fehler waren hier vorprogrammiert, zudem waren enorme Abstimmungsprozesse notwendig und Kompromisse mussten eingegangen werden.
In Microsoft Fabric arbeiten alle zusammen, und zwar auf einer einzigen Datenbasis. Jeder Anwender und jede Anwenderin nutzt Datensätze für seine bzw. ihre Zwecke und kombiniert sie mit den Attributen, die wichtig für den jeweiligen Kontext sind. Alle arbeiten nativ mit denselben Daten in OneLake zusammen. Das schafft Mehrwerte, denn niemand muss sich mehr mit der Erstellung von Integrationen auseinandersetzen, damit unterschiedliche Tools zusammenarbeiten können. Jeder Anwender, jede Anwenderin, jedes Team kann seine eigenen Arbeitsbereiche erstellen und bei Bedarf mit anderen teilen. Daten des einen Arbeitsbereichs können in den anderen integriert werden und umgekehrt. Daten werden einfach einmal in OneLake gespeichert und können im weiteren Analytics-Prozess ohne Duplizierung so oft wie gewünscht verwendet werden.
Brauche ich Microsoft Fabric?
Vielleicht. Der Hype ist jedenfalls berechtigt. User und Userinnen fordern seit Jahren genau solch eine Plattform, die eine nahtlose Data Journey abbilden lässt und zwar von der Integration bis hin zum Dashboarding der Daten.
Mein Rat: Wartet die Preview ab. Testet weiterhin, ob das technologische Angebot für euren Use Case sinnvoll ist. Orientiert euch am Namen Azure Fabric: Fangt an, die ersten Schichten eurer Datenanalyse locker zusammenzulegen und verstärkt eure Basics nach und nach zu einer festen Struktur. Schaut euch die Entwicklung von Fabric an, um nicht den Faden zu verlieren. Es kann der Gamechanger werden.