Techgiganten geven dataset voor onderzoek naar coronavirus vrij

Abonneer je gratis op Techzine!

Een groep Amerikaanse techbedrijven en organisaties hebben de dataset COVID-19 Open Research Dataset (CORD-19) gepubliceerd. Met de dataset krijgen onderzoekers toegang tot populaire wetenschappelijke bronnen rond het coronavirus, om hun gevecht tegen het virus te ondersteunen.

CORD-19 bestaat uit meer dan 24.000 artikelen die tot op heden geschreven zijn over de ziekte COVID-19. De dataset bevat onder andere informatie uit GitHub-data-archieven en ander niet-academisch onderzoek. Ook nieuw onderzoek zal toegevoegd worden aan het project. Via de data science-community Kaggle kunnen onderzoekers hun data mining-tools en inzichten verder delen.

De initiatiefnemers geven daarbij aan dat de enorme dataset ‘machine readable’ is, wat de dataset geschikt maakt voor machine learning-doeleinden. De Allen Institute for Artificial Intelligence, één van de grootse bijdrages aan het initiatief, is er namelijk van overtuigd dat kunstmatige intelligentie (AI) een belangrijke rol speelt bij het oplossen van het probleem. Het heeft onder meer tools ontwikkeld om belangrijke punten te halen uit wetenschappelijke onderzoeken en om onderzoekers de voor hen relevante studies op te laten zoeken.

Partijen willen samenwerking

Microsoft is één van de grote bekende techgiganten die meegeholpen heeft aan CORD-19. “We moeten samenkomen als bedrijven, overheden en wetenschappers, en onze beste technologieën op het gebieden van biomedische geneeskunde, epidemiologie, AI en andere wetenschappen toepassen”, stelt Microsoft-Chief Scientific Officer Eric Horvitz.

De nieuwe dataset is overigens op initiatief van de Office of Science en Technology Policy van het Witte Huis opgezet. De Amerikaanse overheid riep onderzoekleiders uit de technologie, wetenschap en de regering namelijk op om samen te werken.