3min

Tags in dit artikel

, ,

Aan Google’s heerschappij op de markt van zoekmachines komt binnenkort ten einde, tenminste, als het aan Xerox en Powerset ligt. Beide bedrijven zijn een samenwerking aangegaan om een zoekmachine te ontwikkelen die werkt met het zogenaamde natural language principe.

Het kortgeleden opgerichte bedrijf Powerset Inc. in San Francisco is al enige tijd bezig met de ontwikkeling van een zoekmachine die gebaseerd is op natural language. Xerox heeft een eigen onderzoekscentrum, te weten het Palo Alto Research Center (PARC), dat al dertig jaar onderzoek doet op dit gebied.

Powerset is nog maar kort actief, maar heeft hoge verwachtingen weten te wekken bij investeerders, die in totaal al 12,5 miljoen dollar in het bedrijf staken. Sinds september 2005 onderhandelt het bedrijf al met PARC om technologieën te mogen gebruiken bij de ontwikkeling van de zoekmachine. Dat is nu dus gelukt en het is zelfs zo dat Ron Kaplan overstapt van PARC naar Powerset. Kaplan stond bij PARC aan het hoofd van het team dat onderzoek deed naar natural language. Verder heeft Powerset nu een licentie op de technieken van PARC, terwijl Xerox aandelen krijgt in Powerset en mag delen in de opbrengsten.

Maar wat is natural language processing nou precies. Volgens Barney Pell, oprichter van Powerset, is het verschil tussen deze techniek en de huidige zoektechnieken vrij duidelijk. Zoekmachines als Google en Microsofts Live Search, indexeren webpagina’s en kijken naar sleutelwoorden. Daarnaast zijn nog een aantal factoren belangrijk, maar als je op een dergelijke zoekmachine een zoekopdracht uitvoert moet je zoeken op deze sleutelwoorden.

Bij natural language processing indexeert de zoekmachine een website zoals een mens zou doen. De zoekmachine kan de zinnen lezen en relaties leggen tussen verschillende woorden. Dat heeft als gevolg dat de zoekmachine ook vragen van internetters kan beantwoorden. De gebruiker zou bijvoorbeeld kunnen vragen "welk bedrijf kocht IBM in 1996?". De zoekmachine zou dan direct het antwoord, of de website met het antwoord kunnen tonen, zonder allerlei sites te tonen die deze of een deel van deze sleutelwoorden bevatten. De resultaten zijn dus veel beperkter, maar ook veel duidelijker.

Volgens Pell is het waar dat sommige zoekmachines, waaronder die van Google ook werken met vragen, maar ook hier wordt er alleen met sleutelwoorden gewerkt, die onderling geen relatie hebben. Pell erkent wel dat natural language processing geen eenvoudige proces is, het is dan ook niet voor niets dat PARC er al dertig jaar onderzoek naar doet. Het lijkt dan ook een illusie dat de zoekmachine van Powerset vanaf het begin al perfect zal werken. Maar volgens Pell is er recent bij PARC wel een doorbraak gedaan op dit gebied en Powerset kan daardoor beschikken over de nieuwste technieken op het gebied van natural language processing.

Dat moet het bedrijf een voorsprong geven op andere bedrijven die bezig zijn met een zoekmachine op basis van deze techniek. Zo heeft het bedrijf Hakia Inc. al een bètaversie van een dergelijke zoekmachine online . Daarnaast werkt de website Answers.com met de he Brainboost search engine die ook gebaseerd is op natural language processing