5min

Microsoft-CEO Satya Nadella omschrijft Fabric als misschien wel de grootste lancering van een dataproduct sinds SQL Server.

Fabric moet namelijk een nieuwe basis vormen voor bedrijfsdata en AI-toepassingen. Beschik je als organisatie over een berg kwalitatieve data en je wilt er een AI-applicatie mee bouwen, dan heb je het eerste onderdeel al op orde. De data moet echter op een goede architectuur kunnen vertrouwen en daar gaat het bij menig groot bedrijf vandaag de dag veelal mis. Ze hebben door de jaren heen hun data-infrastructuur enorm uitgebreid door veel gespecialiseerde tools te omarmen. Die tools zijn heel goed in wat ze moeten doen, maar de tool-explosie maakt het ook lastig om daadwerkelijk data op een goede manier in de hele organisatie in te zetten.

OneDrive voor data

Daar wil Microsoft verandering in brengen, allereerst door eens te kijken naar wat er beter kan binnen het eigen dataproductaanbod. Het techbedrijf voert wat rebrandingen, optimalisaties en combinaties toe. Het resultaat is Fabric. Op dit platform komen Power BI voor datavisualisatie, Azure Synapse Analytics voor warehousing en Azure Data Factory voor integratie samen. Op die manier werkt Microsoft toe naar één platform dat meerdere dataworkloads ondersteunt. Data scientists, engineers en andere professionals kunnen binnen deze omgeving zoveel mogelijk toegang krijgen tot de tools die zij nodig hebben voor hun werkzaamheden.

Om Fabric mogelijk te maken heeft Microsoft ook een sterke koppeling opgezet met de nieuwe oplossing OneLake. Deze tool wordt ook wel omschreven als de “OneDrive voor data”. OneLake is in de basis een data lake die data management moet vereenvoudigen en duplicatie van data belooft te verminderen. Het optimaliseren van data voor verschillende analytics-engines, zoals Spark en T-SQL, moet verleden tijd zijn doordat binnen OneLake alle data in Delta Parquet-formaat opgeslagen wordt. OneLake is automatisch gekoppeld aan iedere Fabric-workload.

Gegevens voor iedere werknemer

Daarmee gaan we ook wat meer richting een ander nieuw streven van Fabric: het moet een brede datacultuur in een bedrijf mogelijk maken. Bij zo’n cultuur maken medewerkers in verschillende afdelingen en functies aanzienlijk meer gebruik van inzichten uit rapporten en analyses dan toe nu toe het geval is. Bijvoorbeeld HR-medewerkers en salesvertegenwoordigers zouden daar meer gebruik van kunnen maken, maar als ze dat nu willen doen moeten ze vaak bij data scientists en data engineers aankloppen. Zij gaan al dan niet met het verzoek aan de slag en komen na uren, dagen of weken met een gewenst inzicht. Een tool die een bredere datacultuur bevordert, kan in theorie bepaalde inzichten en rapporten snel leveren, zonder direct alle verzoeken bij dataexperts te hoeven leggen.

Een voorbeeld van hoe Microsoft dit nu wil realiseren is de Direct Lake-modus in visualisatietool Power BI. Hiermee is een real-time connectie op te zetten van een Power BI-rapport naar data in OneLake. Door deze integratie wordt er slechts één kopie van data gecreëerd, zodat de business users de gegevens altijd kunnen gebruiken zonder dat er datafragmentatie ontstaat. De inzichten uit deze gegevens kunnen gebruikt worden in de Microsoft 365-tools die populair zijn onder business users. Zo worden Microsoft Teams, Outlook en Excel ondersteund.

Een man die op het podium staat tijdens een Microsoft-evenement.

Databronnen integreren in Fabric

We haalden al aan dat Fabric eenvoud wil brengen in het datalandschap van bedrijven. Deze groei aan tools in de data-infrastructuur duidt Microsoft ook wel aan als de ‘modern data estate’: een omgeving met meerdere clouds, accounts, databases, domeinen en engines. Al die zaken blijven als het goed is nog een behoorlijke tijd draaien binnen bedrijven, omdat ze simpelweg nodig zijn voor data-gerelateerde werkzaamheden. Wat OneLake echter wil veranderen, is het eenvoudiger samenbrengen van data op een plek.

Ten eerste moet deze versimpelslag plaatsvinden met wat Microsoft ‘shortcuts’ noemt. Met deze functionaliteit kan het datateam data virtualiseren in OneLake zonder de gegevens te hoeven verplaatsen en dupliceren. De shortcuts zijn te gebruiken om data uit verschillende clouds, accounts en bedrijfsafdelingen te combineren voor een dataproduct. Vooralsnog zijn er shortcuts voor Azure Data Lake Storage Gen2, Amazon S3 en Microsoft Dataverse. Daarnaast maakt Microsoft het mogelijk om in de Power Apps-omgeving een koppeling te leggen met Fabric. Naast data uit het Power Platform wordt hierdoor ook direct data uit het ERP-systeem Dynamics 365 gekoppeld aan Fabric. Dit brengt logischerwijs een hoop kennis over bedrijfsprocessen naar de nieuwe dataomgeving van Microsoft.

Een tweede feature waarmee Microsoft meer eenvoud wil realiseren, noemt het bedrijf Mirroring. Deze functie laat gebruikers bestaande data warehouses en databases toevoegen aan Fabric. Dit zal zeker van pas komen bij grote bedrijven die al tientallen jaren bestaan, omdat zij vaak veel databases en warehouses in gebruik hebben met cruciale gegevens die niet zomaar vervangen kunnen worden. Mirroring repliceert daarom een snapshot van de database naar OneLake in het Delta Parquet-formaat en houdt de replica zoveel mogelijk up-to-date. Aanvankelijk zal er ondersteuning zijn voor Azure Cosmos DB, Azure SQL DB, Snowflake en Mongo DB, al zal Microsoft wel werk maken van het toevoegen van meer databronnen.

De logo's voor de verschillende soorten gegevens.

Ook voor Copilot een rol

Tot slot voegt Microsoft ook generatieve AI toe aan Fabric, in de vorm van Copilot. In de afgelopen maanden is de techgigant druk geweest met het toevoegen van de generatieve AI-assistent aan allerlei toepassingen, door vooral steeds meer in te zetten op AI in zakelijke omgevingen. In Fabric is dit terug te zien in de manier waarop Microsoft data scientists en data engineers ondersteunt. Zij kunnen Copilot gebruiken voor dagelijkse werkzaamheden. Een voorbeeld hiervan is assistentie bij het schrijven van code: Copilot kan de code namelijk automatisch afmaken. Maar het is ook mogelijk om de templates van Copilot voor het bouwen van data pipelines en modellen te gebruiken. Er ligt dan altijd een basis, die als het goed is al snel een deel van de werkzaamheden invult. De data scientists en data engineers kunnen dan de verdere perfectionering en pro-codewerkzaamheden uitvoeren.

Al met al zet Microsoft met Fabric dus best wat stappen om wat teweeg te brengen in de datawereld. Of het SQL Server zal evenaren of overtreffen, zal moeten blijken. Microsoft is immers niet de eerste techleverancier die met een dergelijke manier voor opschudding wil zorgen, maar een stevige ambitie kan zeker geen kwaad.

Na een periode van previews is Fabric recent algemeen beschikbaar voor ieder geïnteresseerd bedrijf.

Tip: Microsoft Teams krijgt Intelligent Recap-functie