Google verbetert zoekmachine met NLP-model BERT

Google heeft een grote stap genomen om de algoritmes van zijn zoekmachine te verbeteren. Het heeft namelijk zijn techniek voor natural language processing (NLP) genaamd BERT onderdeel gemaakt van de algoritmes, om de intentie achter zoekopdrachten beter te begrijpen. 

BERT staat voor Bidirectional Encoder Representations from Transformers. De techniek werd vorig jaar door Google open source gemaakt. BERT is een techniek voor NLP waarmee iedereen zijn eigen state-of-the-art systeem voor het beantwoorden van vragen kan bouwen, aldus Google in een blogbericht.

De techniek is bijzonder omdat het transformers gebruikt. Transformers zijn kunstmatige intelligentie (AI)-modellen die woorden in relatie met de andere woorden in een zin verwerken, in plaats van één voor één. Dergelijke modellen kunnen de volledige context van een woord te begrijpen door te kijken naar de woorden die er voor en na staan. Dat is volgens Google onder meer handig om de intentie achter een zoekopdracht te begrijpen.

Volgens het bedrijf is het begrijpen van die intentie belangrijk, omdat er nog altijd fouten worden gemaakt bij het begrijpen van zoekopdrachten. Dat is zeker het geval bij complexe vragen.

Nieuwe hardware

BERT vereist ook dat er nieuwe hardware gebruikt wordt. “Sommige modellen die we met BERT kunnen bouwen zijn zo complex dat ze tegen de grenzen aankomen van wat we met traditionele hardware kunnen doen”, aldus het bedrijf. Daarom zet Google nu Cloud TPU’s in.

De Cloud TPU’s van Google zijn specifiek ontwikkeld voor kunstmatige intelligentie (AI), waar NLP onderdeel van uitmaakt. De TPU biedt meer computerkracht voor neurale netwerken. De TPU’s worden samengevoegd in ‘pods’, die verbonden worden met het netwerk. Deze pods worden ook al gebruikt voor bijvoorbeeld Google Translate.

Het geheel moet ervoor zorgen dat Google Search beter begrijpt wat een gebruiker bedoelt bij een zoekopdracht. Aan de hand daarvan moet het relevantere zoekresultaten aanbieden. Dit geldt met name voor langere en meer gesprek-achtige zoekopdrachten. De update wordt nu uitgerold.