2min

Microsoft lanceert vandaag een online hub, waar onderzoekers kunnen samenwerken aan kunstmatige intelligentie. Het is de bedoeling dat wetenschappers de datasets die zij als onderdeel van hun werk produceren, op het Microsoft Research Open Data-portal delen.

Het bedrijf geeft zelf al het goede voorbeeld, door enkele tientallen datasets te delen die zijn eigen medewerkers geproduceerd hebben in het kader van verschillende onderzoeksprojecten. Het gaat om verschillende datasets, variërend van gebieden als computerwetenschappen tot biologie.

Samenwerking en onderzoek stimuleren

Hoofdonderzoeker John Krumm van Microsoft laat weten dat hem vaak gevraagd wordt om datasets van onderzoeken te delen. “Het coördineren en samenbrengen van deze datasets op één plek in Azure, zal behulpzaam zijn voor zowel interne als externe onderzoekers”. Het is de bedoeling dat onderzoekers eenvoudig toegang hiertoe krijgen en ook gaan samenwerken met behulp van de datasets.

De onderzoekshub is onderverdeeld in een reeks verschillende gebieden, elk met eigen datasets erin. De een met meer datasets dan de ander. Zo zijn er vooral op vlakken als natural language processing veel datasets beschikbaar. Op andere vlakken, zoals bijvoorbeeld de natuurkunde, zijn weer minder datasets te vinden.

Meer datasets

Dat komt vooral omdat Microsoft de voornaamste verstrekker van datasets is op dit moment. In de toekomst zal dat uiteraard veranderen, naarmate Microsoft erin slaagt om meer wetenschappers en onderzoekers uit andere vakgebieden aan te trekken. Een sterke motivator voor het toevoegen van extra datasets aan de site, ligt natuurlijk in het feit dat extra informatie alleen maar goed is voor AI-projecten, vooral als het aankomt op het trainen van modellen.

De expliciete hoop van Microsoft is dan ook dat er meer datasets op het Microsoft Research Open Data-platform komen te staan.  “Het doel is om een eenvoudig platform te bieden aan onderzoekers van Microsoft en anderen, om hun datasets en daaraan gerelateerde onderzoekstechnieken en -tools te delen,” aldus Vani Mandava, directeur van data science outreach bij Microsoft.

De hub biedt overigens integratie met het Microsoft Azure-cloudplatform.