Google biedt blik op vereiste formaat datasets voor deep learning

Abonneer je gratis op Techzine!

Een van de problemen waar ontwikkelaars mee te maken krijgen als ze werken aan kunstmatige intelligentie, is de hoeveelheid data die nodig is om een systeem werkend te krijgen. De vraag voor sommigen, is hoeveel data er überhaupt nodig is. Google geeft daarover eindelijk wat context.

“Ik zou zeggen dat zo’n beetje elk bedrijf dat tien- of honderdduizenden klanteninteracties heeft, genoeg schaalgrootte heeft bereikt om hierover na te denken,” aldus Jeff Dean, het hoofd van Google’s Brain team. “Als je slechts tien voorbeelden van iets hebt, dan is het erg moeilijk om deep learning aan het werken te krijgen. Maar als je 100.000 dingen hebt waar je iets mee kan, opnames of iets dergelijks, dan heb je de schaalgrootte bereikt waarbij je over dit [deep learning] kunt gaan nadenken.”

Grote kansen

Het potentieel van machine learning is volgens Jeff Dean gigantisch. Hij denkt dat zo’n beetje elk type industrie uiteindelijk de impact ervan zal voelen. De manier waarop hangt vooral van de industrie af en de manier waarop AI ontwikkeld wordt. Het probleem is volgens Dean zo’n beetje dat er op dit moment nog veel menselijk werk verricht moet worden voordat er een goede dataset om mee te werken is.

“Er zit veel werk in machine learning systemen dat niet in de categorie machine learning valt,” aldus Dean. “En je moet daarin nog veel werk verrichten. Je moet de data verzamelen, vervolgens moeten mensen de voorbeelden labelen en moet je een soort pijplijn bouwen die de dataset kan produceren waarmee je vervolgens de machine kan laten werken.”

Zelflerende machines

Google probeert dit proces te vereenvoudigen en doet dat door machine learning te gebruiken om computers zelfstandig te laten leren. Dat is echter nog erg ingewikkeld, en heeft nog veel tijd nodig om goed te kunnen werken. Zeer recent onthulde Google een nieuwe versie van AlphaGo, die zichzelf het Chinese bordspel Go had aangeleerd.

Dat is een ontwikkeling waar Google hard aan werkt en waarin het gelooft, maar veel grotere toepassingen dan het leren van bordspelletjes of zelf herkennen van afbeeldingen, zijn er vooralsnog niet. Google gelooft wel dat voor de ontwikkeling van intelligente computers, dat zelflerend vermogen van groot belang is.