Google ontwikkelt zoekmachine Dataset Search voor academici en journalisten

Stay tuned, abonneer!

Google heeft vandaag een nieuwe zoekmachine uitgebracht. Die richt zich op academici en journalisten en is ontworpen om hen te helpen data die ze nodig hebben makkelijker te vinden. Dataset Search biedt een eenvoudige manier om toegang te krijgen tot “miljoenen datasets” van duizenden bronnen op het internet.

Momenteel bevindt Dataset Search zich nog in een testfase. De tool is gratis in gebruik en volgens onderzoekswetenschapper Natasha Noy van Google bovenal geschikt voor journalisten en wetenschappers. Noy schrijft in een blogpost dat er een toenemend aantal wetenschappers, datajournalisten en dataliefhebbers is, dat “data leeft en ademt”.

Moeilijk vindbaar

Dataset Search is volgens Noy hard nodig, omdat het vaak moeilijk is om gegevens te vinden. Dat komt doordat datasets verspreid zijn over meerdere onderzoekswebsites, waaronder de National Oceanic and Atmospheric Administration en de National Aeronautics and Space Administration. Ook zijn datagedreven nieuwssites als ProPublica vaak erg nuttig. Maar door de grote hoeveelheid plekken waar datasets gevonden kunnen worden, weten veel mensen niet zo goed waar ze moeten beginnen.

Met Dataset Search wordt het echter mogelijk om al die zoekmachines gecombineerd te doorzoeken. Daarvoor zijn gegevens van de sites van uitgeverijen, digitale bibliotheken en persoonlijke webpagina’s van onderzoekers samengevoegd. De tool die door Noy en haar team ontwikkeld is, biedt ook een schema voor de uitgeverijen van datasets die aan de hand daarvan hun gegevens kunnen omschrijven, zodat Google die data ook begrijpt en kan indexeren.

Google probeert zoveel mogelijk leveranciers van datasets aan te moedigen om mee te werken aan Dataset Search. De eerste reacties lijken positief. Vlakblad Nature meldt zelfs dat steeds meer universiteiten hun metadata standaardiseren opdat ze meegenomen worden in de zoekresultaten van Google.

Volgens Noy is Dataset Search het meest geschikt voor onder meer sociale wetenschappen en omgevingswetenschappen. Ook de data van nieuwsorganisaties en overheden zijn goed doorzoekbaar.