Meta’s nieuwe versie van large language model (LLM) Llama zal uiterlijk in mei beschikbaar zijn.
Dat heeft het bedrijf bekendgemaakt tijdens de Meta AI Day in Londen. “In de komende maand, eigenlijk minder, hopelijk in een zeer korte periode, hopen we te beginnen met het uitrollen van onze nieuwe reeks funderingsmodellen van de volgende generatie, Llama 3,” aldus President of Global Affairs Nick Clegg.
Het is de bedoeling dat Llama 3 meerdere producten van Meta zal aandrijven. De social media-gigant wil uiteindelijk een Llama-aangedreven Meta AI bouwen die als meest bruikbare assistent ter wereld fungeert. De verwachting is dat het LLM-model dat over enkele weken wordt gelanceerd, miljarden parameters meer zal bevatten dan zijn voorganger. Het Llama 2-model telt 70 miljard parameters.
Nieuwe capaciteiten
Met deze extra parameters moet de LLM in staat zijn betere antwoorden te geven. Llama 2 was het eerste foundation model van Meta dat publiek beschikbaar was, maar kreeg nog wat kritiek dat het te gelimiteerd was in zijn mogelijkheden. Naar verwachting zal Llama 3 dan ook op veel meer prompts en vragen correct kunnen reageren. Een eerder lek sprak al over het begrijpen van de Engelse vraag “how to kill a vehicle’s engine”, wat betekent dat de motor tijdelijk moet worden uitgeschakeld en niet volledig onbruikbaar dient te worden.
Momenteel moet Llama 2 nog concurrerende modellen achter zich laten in de benchmarks. In de meeste tests scoren bijvoorbeeld GPT-3.5 en Grok-1 nu een stuk beter op het gebied van taalbegrip en wiskunde. Na de release van Llama 3 zal duidelijk worden of Meta de concurrentie wat kan opvoeren.
Tip: Databricks komt met DBRX: open-source LLM dat GPT-3.5 en Llama 2 verslaat