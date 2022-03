Organisaties verplaatsen systemen en data naar cloudplatformen om te profiteren van de prestatie-, flexibiliteit- en schaalbaarheidswinst. De versnelde adoptie leidt tot nieuwe uitdagingen. Zo bevindt data zich door de acceleratie op enorm veel verschillende locaties (silo’s). Deze silo’s dienen aangepakt te worden om inzichten te verbeteren en de bedrijfswaarde te verhogen.

Of het nou gaat om een mobiele applicatie of analytics; de noodzaak om data uit verschillende systemen te verbinden is er. Toch zal het integratieproces complex zijn. De cloud heeft het proces zeker niet versimpeld. De cloud zorgt er namelijk voor dat gegevens in verschillende platformen en systemen opgeslagen zijn, met ook weer verschillende opslagtechnieken. Integratie-uitdagingen lijken zelfs te vergroten door het omarmen van hybrid- en multicloudstrategieën.

Met een data lake kan je silo’s aanpakken door een centrale repository te creëren voor verschillende soorten gegevens. Business developers, oftewel de verantwoordelijken voor het ontwikkelen van applicaties die de data verbruiken, nemen bij een data lake het meeste ontwikkelwerk voor rekening. Een data lake is bijvoorbeeld nuttig voor data science-modellen. Bij een data lake worden de integratiespecificaties voor verschillende toepassingen apart ontwikkeld. Een omslachtig proces dat leidt tot minder productiviteit en moeilijker onderhoud.

Data warehouses zijn weer een hele andere optie. Hiermee implementeer je een architectuur om bijvoorbeeld business intelligence mogelijk te maken. Data engineers nemen voor data warehouses het meeste ontwikkelwerk voor rekening. Zij maken de integratiespecificaties, om ze vervolgens te hergebruiken. Data warehouses zijn wel minder flexibel, aangezien data meerdere keren gekopieerd wordt voordat het beschikbaar is voor gebruik. De latency is bij data warehouses over het algemeen hoog, wat voor real-time data verbruik niet werkt.

Datavirtualisatie

Een hele andere werkwijze is gebaseerd op datavirtualisatie. Hierbij worden de beste onderdelen van de lakes en warehouses gecombineerd. Data engineers ontwikkelen de integratiespecificaties, zodat ze herbruikbaar zijn. Daarnaast is er minder behoefte aan het maken van redundante kopieën van de data. Het verlaagt de data latency, om real-time data verbruik te ondersteunen.

Een datavirtualisatieserver maakt toegang tot alle soorten dataopslagtechnologieën mogelijk. Voor bedrijven is dat interessant, aangezien ze hiermee voordeel kunnen halen uit de gespecialiseerde technieken van cloudplatformen. Bovendien wordt de gebruiker van de data ontkoppeld van opslag. Het feit dat er een hybride, multi-cloudomgeving gebruikt wordt, is niet meer te merken.

Datavirtualisatie is daarmee een relatief eenvoudige manier om cloud data silo's aan te pakken.