2min

Tags in dit artikel

, ,

Speller100 werkt via kunstmatige intelligentie en wordt gebruikt voor de Microsoft zoekmachine Bing. Microsoft is er uitermate trots op: “We zijn overtuigd dat Speller100 het meest uitgebreide spellingscontrolesysteem is waar het gaat om accuratie en de hoeveel talen die kan verwerken.”

Vooral het aantal talen is indrukwekkend: Bing doet het normaliter slechts voor 25 talen. Zeker talen die niet zo veelvuldig aanwezig zijn op het internet werken niet lekker samen met Bing. Speller100 moet in dat gat springen omdat het zoveel talen kent en dus ook eerder woorden herkent uit minder aanwezige talen wanneer deze tot dezelfde taalfamilie behoren.

Speller100

Denk daarbij aan het woord twee in het Nederlands. Dit is twee in Afrikaans, zwei in Duits, zwee in Luxemburgs en two in Engels. Dat is allemaal vrij overeenkomstig. Hetzelfde geldt voor woorden zoals bloed en vinger. Worden fouten gecorrigeerd, dan leert het systeem hier ook weer van: een groot voordeel van kunstmatige intelligentie. Het wordt de zero-shot methode genoemd.

Microsoft: “Stel je voor dat iemand je heeft geleerd hoe je in het Engels moet spellen en dat je automatisch ook hebt leren spellen in het Duits, Nederlands, Afrikaans, Schots en Luxemburgs. Dat is wat zero-shot learning mogelijk maakt. Het is een sleutelcomponent in Speller100 waarmee we kunnen uitbreiden naar talen met zeer weinig tot geen gegevens.”

Spellingscontrole

Dankzij kunstmatige intelligentie kan Bing straks beter omgaan met spellingsfouten. Microsoft wordt vanzelf aangepast als iemand micorsoft, micrrosoft, micrsoft of mictosoft schrijft. Microsoft: “Deze tekst kan gemakkelijk worden opgehaald door middel van webcrawlen, en er is voldoende tekst om honderden talen te trainen.” Het is uit een test gebleken dat het aantal keer dat gebruikers op een spellingssuggestie klikken met 67 procent omhoog is gegaan.

Bing is een logische eerste stap voor de introductie van Speller100, maar het zal mogelijk in de toekomst ook in andere producten van Microsoft worden geïntegreerd. Zo schrijft TheNextWeb. Misschien wel de spellingscontrole van Word.