2min

Tags in dit artikel

, ,

AWS heeft onlangs de open-source tool Graph Notebook gelanceerd. Met deze tool kunnen data scientsits makkelijker in graph databases opgeslagen data analyseren en visualiseren.

Graph databases zijn gespecialiseerde databases waarin data als ‘grafische’ informatie is opgeslagen. Dit soort databases slaan niet alleen individuele records op, zoals de namen van klanten of waarde van gekochte goederen, maar ook de relaties tussen die records. Bijvoorbeeld welke klant welke aankoop heeft gedaan.

Het leggen van relaties tussen de afzonderlijke records met informatie is voor vele use cases zeer bruikbaar. Daarom worden graph databases vooral gebruikt voor onder meer aanbevelings-engines, cybersecuritysystemen en wetenschappelijke projecten.

AWS Graph Notebook

De nu uitgebrachte open-source tool AWS Graph Notebook moet het werken met deze graph databases makkelijker maken. Met de tool kunnen data scientists beter patronen vinden in grote hoeveelheden records en hiertussen relaties leggen. AWS Graph Notebook maakt het ook makkelijker om de gevonden gegevens en relaties te visualiseren.

Visualisatieproces

Het visualisatieproces vindt plaats met behulp van Jupyter Notebook. Dit is een data science-tool voor analytics dat Python-code tegenover datasets laat draaien en zo snel de gewenste resultaten naar boven brengt. Met AWS Grap Notebook kunnen eindgebruikers concreet een Jupyter Notebook-query aanmaken om een specifiek subset van de informatie in een graph database te extraheren en deze subset aan data vervolgens te visualiseren. De data worden vervolgens gevisualiseerd op een kaart.

Relatie met AWS Neptune

Voor het opstellen van de query zijn twee zoektalen beschikbaar, het veel voor grote graph databases gebruikte Gremlin en de meer niche SPARQL-syntax. Beide zoektalen zijn geoptimaliseerd voor het analyseren van data die in het graph-formaat is opgeslagen.

De talen worden ook ondersteund door de eigen beheerde graph-database van AWS: AWS Neptune. Volgens AWS kan AWS Graph Notebook samen met deze eigen beheerde graph database worden gebruikt, maar ook in een andere omgeving worden uitgerold. Bijvoorbeeld een AWS EC2-instance.

AWS Graph Notebook is per direct beschikbaar op GitHub onder een Apache 2.0-licentie.