Tableau wil analytics begrijpelijk maken voor iedereen

Abonneer je gratis op Techzine!

Voor de twaalfde editie van de Tableau Conference (TC19) trokken medio november 20.000 datamensen naar Las Vegas om zich drie dagen lang te wentelen in datavisualisatie. De centrale boodschap: data maken de wereld beter, zolang data het verhaal goed vertellen. NLP en Machine Learning moeten dat nog makkelijker maken, met de nieuwe Tableau-functies Ask Data en Explain Data.

Tableau Software, maker van Business Intelligence software, heeft inmiddels meer dan een miljoen gebruikers in zo’n 65 landen. Onder hun klanten bekende namen als British Airways, Citrix, LinkedIn, Sisheido en Verizon. Tableau werkt samen met AWS, Google Cloud, Microsoft Azure en Alibaba Cloud en voor een overnamebedrag van 15,7 miljard dollar, horen ze sinds deze zomer “bij de Salesforce-familie”.

Meer vrouwen

Wat bij de Tableau Conference opviel was de aandacht voor maatschappelijke kwesties en emancipatie. Veel diversiteit in het beeldgebruik rondom de conferentie, veel diversiteit ook op het podium. In de keynote van Tableau-president en CEO Adam Selipsky ook specifiek aandacht voor datavaardige vrouwen uit de geschiedenis. Voor het illustreren van het hedendaags belang van ‘data literacy’ of datavaardigheid trok hij een parallel met de Tweede Wereldoorlog. Geheimschrift en gecodeerde berichten vormden een belangrijk onderdeel van oorlogsvoering. Cryptografie bereikte nieuwe hoogten en de VS had lang niet genoeg codebrekers en cryptoanalisten. “Wat de VS nodig had was een datacultuur,” aldus Selipsky.

De overheid begon op universiteiten vrijgezelle studenten te werven die graag puzzels oplosten, maar de helft van 19-29 jarige mannen was verscheept naar oorlogsgebied. De overheid besloot om dan maar in te zetten op vrouwen en verplaatste de wervingscampagne naar PABO’s. Dat hele verhaal staat beschreven in het boek Code Girls van Liza Mundy, spreker op TC19.

Datacultuur best practices

Het punt is dat een nieuwe golf werknemers zich aanbood, die allemaal nieuwe vaardigheden moesten leren. In vier jaar schoot het aantal codebrekers van een paar honderd specialisten naar twintigduizend getrainde professionals. “Niet iedereen hoefde op topniveau te werken,” legde Selipsky uit. “De VS had vooral behoefte aan veel mensen, met datavaardigheid op verschillende niveaus.” Evenmin had iedereen toegang nodig tot alle data, alleen tot die nodig waren om hun werk goed te doen.

Dit korte verhaal over het opzetten van een datacultuur vormde een handige brug naar de introductie van Tableau Blueprint. Dit is een methodologie voor het opzetten van een datacultuur binnen de eigen organisatie, met behulp van Tableau.

Salariskloven en andere waarden

Vervolgens betrad Marc Benioff het podium, de oprichter en co-CEO van Salesforce, voor een vrolijk een-tweetje met Selipsky. Veel bezoekers prezen de spontaniteit van het gesprek en het gebrek aan commercieel gepraat. Anderen verbaasden zich over de nonchalance waarmee Benioff  – met baard en hoed – kletsend in zijn stoel hing.

De toon werd serieuzer toen Selipsky vroeg wat maakte dat Benioff indertijd zijn oog had laten vallen op Tableau. Hij zei: “Weinig bedrijven lijken zo op Salesforce in klanten, cultuur en waarden.” Hij prees Selipsky’s openingsverhaal “dat zo de nadruk legde op emancipatie, want gelijke rechten is voor ons een kernwaarde. Dat begint bij ons met gelijke betaling voor mannen en vrouwen.” Het kostte Salesforce tien miljoen dollar om de salariskloof te slechten in het eigen bedrijf, maar klaar zijn ze nog niet. “Wanneer je een bedrijf koopt, dan koop je ook hun loonschalen. Daarmee worden het onze loonschalen en dus moeten wij zorgen dat ook die gelijk zijn voor mannen en vrouwen bij gelijke werkzaamheden.”

Uiteindelijk zijn waarden belangrijker dan de technologie, stelde Bernioff.  Met een breed armgebaar wuifde hij richting publiek: “Als de technologie over tien jaar verdwenen is, dan bestaan de kernwaarden nog steeds. Net zoals de energie in de zaal.” Hij bedoelde vast niet dat Tableau over tien jaar niet meer als dusdanig bestaat, gezien het gejuich van het publiek. Over de toekomst zei Benioff: “Salesforce gaat over klanten. Jullie gaan over analytics. We hebben Customer 360, jullie hebben data. En wij houden van data.” Selipsky: “En wij delen jullie passie voor de klant.”

Nieuwe Tableau-features

In het afgelopen jaar werd Tableau’s functionaliteit uitgebreid met 200 nieuwe features. Een van de add-ons is Catalog. Dit is een index van meta-informatie die gebruikers de bron van data laat zien waar data binnen het bedrijf worden gebruikt, door wie en in welk proces. Het idee is dat meer inzicht leidt tot beter databeheer. Maar ook dat data die door meer mensen worden gebruikt, betrouwbaarder zouden zijn. Omdat zichtbaar is wie met wat werkt, kunnen in geval van problemen alle relevante gebruikers makkelijk geïnformeerd worden. Als bijvoorbeeld dezelfde laptop iedere keer opduikt als bron van dubieuze rapportage, dan kan gericht actie worden genomen.

Ask Data

Twee andere features voor het voetlicht waren Ask Data en Explain Data. Ask Data gebruikt Natural Language Processing om gebruikers in normale taal analyses te laten uitvoeren. De gebruiker hoeft geen formules te kennen, maar kan bijvoorbeeld data ordenen op de tekst ‘hoe veel in juni en juli’. In de illustraties Superstore en Sales Performance zie je dat in plaats van formules, gewone taal wordt gebruikt. Een vorm van autocorrect vult de meestgebruikte termen aan, zoals sorteer, in oplopende volgorde, gemiddeld. De resultaten van de zoekopdrachten zijn onmiddellijk zichtbaar in de visualisatie.

Explain Data

Explain Data analyseert de uitkomst van de visuele analyse op basis van onderliggende modellen. Als een visualisatie vreemde verschijnselen vertoont – denk uitschieters en uitzonderingen – dan klikt de gebruiker op Explain Data. De software berekent vervolgens mogelijke oorzaken en selecteert de meest waarschijnlijke, op basis van de relaties tussen de gebruikte data. Zie de ‘bike-trio’-illustraties. “Statistische analytics voor iedereen, in seconden,” aldus spreker Samantha Kwok, senior manager engineering.

In al dat gebruiksgemak zit wel een risico. Gebruikers die de basis van data-analyse niet begrijpen kunnen door blijven klikken tot ze een uitkomst vinden die hen goed bevalt. Mark Jewett, VP Marketing van Tableau, zei in een interview over datacultuur dat het belangrijk is dat mensen  wel enige datavaardigheid hebben. “Dat ze het verschil kennen tussen correlatie en casualiteit: soms is er een verband tussen twee zaken, zonder dat het een het ander veroorzaakt.” Neem onderstaande grafiek, die de afname van het aantal piraten in de afgelopen 180 jaar laat zien en de stijging van de gemiddelde temperatuur wereldwijd. Dit is echter geen causaal verband: het een is niet de oorzaak van het ander.

Iron Viz

Tableau is zakelijke software, maar kan rekenen op een community van fanatieke gebruikers. Dit werd zeer duidelijk tijdens Iron Viz, een live wedstrijd in datavisualisatie. Na een jaar van voorrondes door duizenden deelnemers strijden drie finalisten om de titel, onder gejuich van duizenden. In de praktijk is dat dus drie mensen achter een toetsenbord en scherm, die als een razende klikken en slepen, terwijl twee presentators live commentaar leveren. Seeing is believing.

Jewett zegt over de community: “Onze software vormde de basis, het begin. Mensen hielden van data en zij hielden ervan Tableau te gebruiken. Er ging een wereld voor hen open en daar wilden ze anderen over vertellen en hen helpen hun werk beter te doen. Het enige dat wij nu doen is onze community faciliteren middels een infrastructuur van forums, ambassadeurs en gebruikersgroepen. Het is de passie en de energie van de mensen zelf die de community gaande houden. En Iron Viz is daar een opmerkelijk voorbeeld van.”