6min

Deze week bezocht Techzine de Big Data Expo in de Jaarbeurs. Een evenement waarin allerlei vendoren uit de data-industrie samenkomen. Een goede plek dus voor bedrijven om hun licht op te steken over de mogelijkheden van data. De belangrijkste les van dit event was toch wel dat data zeer belangrijk is, maar Big Data niet zozeer.

Op de Big Data Expo kon je in gesprek met allerlei leveranciers die actief zijn in de data-industrie, maar er waren ook veel kennissessies van grote organisaties die hun kennis kwamen delen. Zo waren onder meer Jumbo, Schiphol, de Politie, Vattenfall, Booking.com en flink wat universiteiten van de partij. De sessies werden zeer goed bezocht en zaten geregeld vol.

De drukte en de interesse voor de kennissessies laat zien dat data de interesse heeft van veel mensen en organisaties. Deze voelen de noodzaak om te innoveren en om bedrijfsprocessen te optimaliseren. De enige manier waarop dat goed kan is kijken naar je data, die goed analyseren en daar vervolgens conclusies uit trekken. Het probleem is echter dat veel organisaties geen flauw idee hebben hoe ze dit goed moeten aanpakken.

Een van de openingssessies werd verzorgd door Dataiku. Die hebben een duidelijke insteek. Data is zeker belangrijk, maar Big Data is achterhaald. Dat wil zeggen, het gaat al lang niet meer om het verzamelen van zoveel mogelijk data. Met Big Data geef je eigenlijk het verkeerde signaal af. Je moet de juiste data verzamelen en analyseren, maar ook het hele proces rondom het verzamelen en analyseren moet vooraf goed in kaart worden gebracht.

Bedrijven doen te vaak iets met data omdat het de trend is

Bij Dataiku zien ze te vaak organisaties die al een tijdje bezig zijn met data, maar nog geen resultaat halen. Vaak is het probleem dat er door een IT-afdeling een gigantisch data-platform is opgebouwd, waar dan geen gebruik van gemaakt wordt. Er is geen interne klant die hier gebruik van wil maken.

Te veel organisaties zijn met de trend meegegaan en hebben geïnvesteerd in een dataplatform, zonder een echt duidelijk beeld te hebben van wat ze verwachten van die data. Daarom stellen ze bij Dataiku ook dat Big Data achterhaald is. Een enorme bak met data biedt namelijk geen oplossingen. Men moet binnen de organisatie in gesprek met de verschillende afdelingen en die bij de datastrategie betrekken. Een HR-medewerker zal niet gelijk aan de slag gaan met een Big Data-platform, simpelweg omdat je aangeeft dat dit er is. Die gaat ervan uit dat iemand van de IT-afdeling ermee aan de slag gaat. Daar gaat het dus mis.

Zoek een interne klant, betrek meer afdelingen bij de data-strategie

Je moet als organisatie alle afdelingen die baat kunnen hebben bij data ook betrekken bij de datastrategie. In bovenstaand voorbeeld van de HR-afdeling moet je in gesprek gaan daarmee. Probeer inzichtelijk te krijgen welke data bruikbaar is. Hetzelfde geldt voor een afdeling die verantwoordelijk is voor inkoop, productontwikkeling en ga zo maar door.

Als je als organisatie de behoefte inzichtelijk kan maken, dan heb je een interne klant. Als je vervolgens de data kan verzamelen die relevant is voor bijvoorbeeld de HR-afdeling, dan kan je echt stappen gaan zetten. Op het moment dat die data in je dataplatform zit, kan je die gaan analyseren met een goede analytics of AI-tool. Dat is waar de tools van Dataiku om de hoek komen kijken. Die helpen ook normale normale zakelijke gebruikers om analyses te doen. Dataiku is overigens niet de enige die dit kan of zegt te kunnen. Op de Big Data Expo stonden nog veel meer bedrijven die iets soortgelijks aanbieden.

TIP: We hebben enkele maanden geleden een rondetafel gehouden over dit onderwerp, waar Dataiku toen ook bij aanwezig was. In het artikel dat we hierover hebben gepubliceerd, komt dit onderwerp ook aan bod.

Meer bedrijven zelfde visie

We hebben van meerdere sessies wat meegepikt, maar ook vooral met veel standhouders gesproken. De boodschap was eigenlijk overal wel een beetje hetzelfde. Ga niet meteen een enorm dataplatform bouwen, maar begin wat kleiner, ontwikkel een goede strategie en betrek meer mensen binnen de organisatie hierbij.

Veel van deze leveranciers zijn enorm hard gegroeid, omdat veel organisaties iets met data wilden doen. Inmiddels proeven we dat ze een beetje tegen dezelfde problemen aanlopen. De klanten zijn wat te hard van stapel gelopen, hebben fors geïnvesteerd, maar te weinig resultaat behaald. Al die klanten zijn op de datatrein gesprongen, maar door een gebrek aan resultaten lijkt de datastrategie binnen die organisaties te gaan ontsporen.

Stapsgewijze datastrategie zorgt voor een doel en een interne klant

Bedrijven die blind op de datatrein zijn gesprongen moeten dus terug naar de tekentafel. Bedrijven die willen beginnen met data, moeten niet dezelfde fouten gaan maken. Het advies is dan ook om wat kleiner te beginnen en vooral op zoek te gaan naar een interne klant of interne klanten.

Interne klanten zijn mensen of teams binnen je organisatie die onder woorden kunnen brengen welke data-analyses ze graag zouden willen. Denk bijvoorbeeld aan analyses om het rendement van medewerkers op het callcenter te verhogen. Of het inzichtelijk krijgen van allerlei inkooporders van productiematerialen. Verder moeten de mensen in die teams ook bereid zijn er zelf tijd in te steken.

Je kan als IT-afdeling een gerichte dataset faciliteren en met een visuele tool een analyse voor ze maken op basis van die data. Het verschil wordt echter vaak gemaakt als die teams ook zelf met zo’n tool aan de gang kunnen. Zij weten vanuit het zakelijke perspectief namelijk vaak onbewust waarop ze moeten filteren om de meest waardevolle resultaten boven tafel te krijgen. Waardoor beslissingen genomen kunnen worden die echt verschil maken.

bigdataexpo-keynote

Stoppen met Big Data

Als gevolg van bovenstaande benadering is het advies ook om te stoppen met Big Data. Of dat ook gaat gebeuren betwijfelen we. Bedrijven vinden het vaak lastig om data weg te gooien. Wat als blijkt dat je die data in de toekomst toch nog nodig hebt? Het is vergelijkbaar met de ouderwetse archiefkast op veel kantoren. Die stonden vaak vol met mappen vol met papieren waar niemand meer naar omkeek. Die mappen bleven vaak jaren staan, omdat niemand het weg durfde te gooien.

Die situatie hebben bedrijven nu ook met Big Data lakes. Toch is het beter om gerichter data te verzamelen en te analyseren. Ten eerste is het veel goedkoper. Het opslaan van data is vandaag de dag op zich niet meer zo duur. Als je echter AI-workloads gaat inzetten om data te analyseren, dan lopen de kosten toch hard op. Dat zijn namelijk de allerduurste workloads die er zijn. Als je zo’n AI-workload door een heel datalake heen laat ploeteren dan schiet de rekening ook fors omhoog.

Tot slot zijn steeds meer bedrijven bezig met duurzaam ondernemen. Als je massaal data blijft opslaan die niet wordt gebruikt, maar er wel een heel serverpark in de lucht moet worden gehouden, ben je niet echt duurzaam bezig.

Op basis van bovenstaande adviezen kan de Big Data Expo wellicht volgend jaar beter door als Data Expo. Of wellicht kunnen ze gezien het succes van het event de zalen wat groter te maken, en op die manier big zijn. Een succes was de Big Data Expo op basis van het aantal bezoekers in ieder geval sowieso. Als het nog iets groter aangepakt wordt, zit daar nog wel de nodige rek in. Er was in ieder geval meer dan genoeg animo voor de kennissessies over data.