Met Collibra kan je data inzichtelijk en compliant maken

Collibra biedt een zogenaamd data governance platform, een platform voor vertrouwen in gegevens, omdat je kan vastleggen welke data er in het bedrijf aanwezig is, hoe die data is opgeslagen, waar de data zich bevindt, wie er binnen het bedrijf verantwoordelijk is voor de data en wie er toegang hebben tot de data. Voor bedrijven is het steeds belangrijker om overzicht te krijgen in alle data. Niet alleen vanuit een juridisch en wetgevend standpunt (defensive data strategy), maar ook om bedrijfsprocessen te verbeteren en in sommige gevallen om simpelweg meer geld te verdienen (offensive data strategy), door op een volwassen manier met gegevens om te gaan.

Collibra is van oorsprong een Belgisch bedrijf, maar rond 2014 zijn de oprichters naar de Verenigde Staten verhuisd. De voornaamste reden hiervoor is dat de Verenigde Staten één grote open markt is waar een bedrijf als Collibra heel snel kan groeien en dus ook de meeste kans van slagen heeft. Inmiddels heeft het bedrijf een aardige voet aan de grond in de VS en is het ook in Europa flink uitgebreid met kantoren in Amsterdam, Parijs, Londen en Frankfurt. In België zijn ze overigens nooit helemaal vertrokken. De softwareontwikkeling wordt vanuit Brussel en Wrowlaw (Polen) gedaan.

Data governance is geen nieuw onderwerp in gegevensbeheer, maar qua uitvoering in bedrijven wel redelijk jong. Veel bedrijven zijn de afgelopen jaren pas voorzichtig gaan kijken wat ze hiermee kunnen of moeten. De nieuwe GDPR-wetgeving zorgt er bij bedrijven weliswaar voor dat ze nu moeten kijken naar hun databeleid, maar volgens Stijn Christiaens, een van de oprichters, is dit slechts één van de business drivers voor Collibra. Het platform wat zij bieden gaat veel verder dan simpelweg compliant zijn aan GDPR (het Nederlandse AVG). Het is één van de zaken die Collibra kan bieden, maar het product als GDPR-oplossing wegzetten zou het simpelweg te kort doen.

We hebben Christiaens inmiddels meerdere malen gesproken over zijn product. De eerste keer was tijdens AWS Re:Invent en daarna nog via Skype om een beter beeld te krijgen van de oplossing.

Leren omgaan met data

Voor veel bedrijven valt er nog veel te leren op het gebied van data. Door alle druk vanuit overheden en de nieuwe wetgeving ligt er wel een druk op datamanagement. Wat ze bij Collibra vaak zien is dat bedrijven op zoek zijn naar een dienst vanuit een enkele doelstelling. Bijvoorbeeld het beveiligen en verdedigen van bedrijfsdata terwijl het gebruiken van data voor commerciële doeleinden net zo belangrijk kan zijn. Bij grote bedrijven liggen deze verantwoordelijkheden vaak bij verschillende divisies en is het goed om intern samen op te trekken. Op die manier kan je de meest efficiënte oplossing kiezen.

Framework en beleid opstellen

Wie is er binnen het bedrijf verantwoordelijk voor het beheer en veiligstellen van data? Het lijkt een simpele vraag, maar bij veel bedrijven wijzen verschillende personen naar elkaar. Bijvoorbeeld de Chief Data Officer, Chief Analytics Officer en de Chief Information Security Officer. Volgens Collibra is uiteindelijk de hele organisatie verantwoordelijk voor alle bedrijfsdata, maar qua beveiliging is het doorgaans de taak van de Chief Information Security Officer (CISO) om het juiste framework op te tuigen en een goed beleid op te stellen hoe men om dient te gaan met data. Hoe moet er met data gewerkt worden, hoe moet data worden opgeslagen, hoe mag de data worden verwerkt en wie heeft er toegang tot de data.

Wel kan het in sommige organisaties handig zijn om bepaalde personen of divisies verantwoordelijk te maken voor een deel van de bedrijfsdata dat voor hen het meest belangrijk is. Op die manier kan je als complete organisatie controle houden over bedrijfsdata.

Verzamelen en vastleggen van data

Het opzetten van een framework begint bij het vastleggen en verzamelen van data. Elke databron en rapportagetool moet worden vastgelegd. Daarbij is het heel belangrijk dat ook goed wordt vastgelegd om wat voor data het gaat, wat voor gegevens zich bevinden in een dataset, bijvoorbeeld persoonsgegevens, omzetcijfers of prestaties.

In sommige gevallen is het ook verstandig om vast te leggen hoe betrouwbaar de data is. Sommige databronnen zijn enigszins vervuild en binnen een organisatie is het goed om bij te houden hoe betrouwbaar de gegevens zijn. Mensen die regelmatig met een databron werken kunnen hier vaak zinnige informatie over geven. Het is dan ook belangrijk om die informatie over eventuele vervuiling te verwerken, zeker als bijvoorbeeld het management grote beslissingen gaat nemen op basis van een databron die intern te boek staat als vervuild. Stel dat een databron voor 50 procent onbetrouwbaar of vervuild is, dan zou een bedrijf desastreuze keuzes kunnen maken op basis van die data. Als men weet hoe onbetrouwbaar de data is, wordt zo’n keuze hoogstwaarschijnlijk niet gemaakt.

Tot slot is het uiteraard van belang om te weten wie er allemaal toegang hebben tot welke data en wie er uiteindelijk verantwoordelijk is voor de data, mochten er vragen over komen. Of als er bijvoorbeeld data uitlekt, dan kan je als bedrijf aantonen wie er binnen en eventueel buiten de organisatie toegang heeft gehad tot de data.

Als blijkt dat het bedrijf er alles aan heeft gedaan om vertrouwelijke data zoveel mogelijk te beschermen en veilig op te slaan, is de kans dat er een hoge boete wordt uitgedeeld bij het uitlekken van de data een stuk kleiner. Bovendien is het bedrijf dan goed georganiseerd om te schade te herstellen, zowel wat betreft het dichten van de lekken in de dataketen als de juiste communicatie naar de markt om de reputatie te beschermen.

Governance

Als alle data is vastgelegd in een platform kan vervolgens worden gekeken hoe dit het beste te beveiligen is. In sommige gevallen zullen er overeenkomsten moeten worden gesloten met leveranciers om de data daar te mogen opslaan of te verwerken. Ook kan worden gekeken of de toegang tot de data kan worden beperkt tot de personen of groepen binnen het bedrijf voor wie de data relevant is. Of als de data extern toegankelijk is, hoe dat zoveel mogelijk kan worden beperkt.

Commerciële voordelen

In het stukje Governance gaat het over het algemeen over het veiligstellen van data en het bewaren van de privacy van werknemers, klanten en relaties. Als alle data goed is vastgelegd en de bekende rapportagetools (zoals Tableau) zijn gekoppeld, is het ook mogelijk om data te gebruiken om er wijzer van te worden.

Met een tool als Collibra krijg je inzichtelijk welke data er allemaal in het bedrijf aanwezig is, maar dus ook welke data beschikbaar is om te analyseren. Door bepaalde data te koppelen kan een goede data-analist hele waardevolle conclusies trekken. Zo kunnen bijvoorbeeld inefficiente procedures worden gevonden of werknemers die minder zijn gaan presteren. Met de juiste aanpassingen of trainingen kan dat vervolgens worden hersteld, waardoor de output omhoog gaat en het bedrijf meer geld kan verdienen of kosten kan besparen. Er zijn inmiddels genoeg voorbeelden van data analyses die bedrijven hebben geholpen veel beter te presteren.

Vinden van de juiste data

In grote bedrijven wordt vaak gewerkt met gestandaardiseerde rapporten waarin allerlei belangrijke cijfers van een bedrijf zijn te vinden. Via self service BI tools, zoals Tableau, Qlik en PowerBI, zijn deze cijfers vaak boven water te krijgen. Naarmate een organisatie langer bestaat zie je vaak dat er steeds meer rapporten bijkomen en sommige bedrijven tientallen, honderden of zelfs duizenden rapporten uitdraaien. Als het management vervolgens op zoek is naar een enkel cijfer in een van die rapporten, bijvoorbeeld customer lifetime value, dan begint de zoektocht naar het juiste rapport. Met een tool als Collibra kan je via de zoekfunctie snel het juiste rapport vinden.

Het hebben van data is dus de eerste stap, het in een catalogus vastleggen is stap twee, maar vervolgens de data eenvoudig kunnen vinden en gebruiken is nog een derde stap.

Commercieel versus veiligstellen van data

Wat is belangrijker voor de meeste bedrijven; de commerciële voordelen uit data halen of het beveiligen en beschermen van de data? En gaat het ene niet ten koste van het andere? Dat vroegen we aan Christiaens die inmiddels al veel bedrijven heeft geholpen met het uitrollen van hun product. Hij stelt dat het uiteindelijk gaat om de juiste balans. Daarnaast moet je als bedrijf natuurlijk goed afwegen hoe je data inzet om je bedrijfsvoering te verbeteren. Dat mag nooit ten kosten gaan van de privacy van je klanten of personeel. Daarvoor is een goed beleid en informatievoorziening nodig. Daarom is dat altijd de eerste stap – het maken, uitvoeren en opvolgen van een goed beleid.