3min Analytics

Nvidia NVLM strijdt met GPT-4o, maar open-source is het niet

Nvidia NVLM strijdt met GPT-4o, maar open-source is het niet

Sinds OpenAI eind 2023 zicht toevoegde aan GPT-4, is de AI-wapenwedloop gaan draaien om multimodaliteit. Dat gebeurt echter veel te vaak op een gesloten manier, stellen Nvidia-onderzoekers. Hun nieuwste creatie, een modellenfamilie genaamd NVLM 1.0, is open en geavanceerd. Écht open-source is het echter niet.

De krachtigste NVLM-variant luistert naar de naam NVLM-D-72B, verwijzend naar de 72 miljard parameters die dit model telt. In inmiddels welbekende AI-benchmarks komt het sterk uit de voeten, ook al gaan concurrerende modellen er regelmatig met de winst vandoor. Beelden begrijpt NVLM wel beter dan de rest. Dat alleen al is een knap staaltje coderen, maar het feit dat de tekstuele prestaties op peil blijven is de voornaamste academische winst. De volledige testsuite en de aard van het model wordt uitgebreid uitgelegd in het wetenschappelijke paper.

Hierin vertelt Nvidia een wat ander verhaal dan Google (Gemini), Anthropic (Claude) en Meta (Llama) toen zij een gooi deden naar de beste scores uit de AI-tests. Hoewel het hertesten op basis van die benchmarks best mogelijk is op onafhankelijke wijze, zeggen ze eigenlijk niet zoveel. Benchmarks staan goed, maar uit werkelijk gebruik blijkt meermaals dat elk model weer eigen trekjes kent.

Open is niet open-source

GPT-4 (en diens varianten/opvolgers) zit achter slot en grendel. Meta’s Llama-modellen zijn daarentegen een stuk transparanter, hoewel daar sprake is van open-access. Dat wil zeggen: er is geen volledige toegang tot de trainingsdata en het gebruik ervan is sterk gelimiteerd. Meta doet Llama 3.2 dus niet cadeau, zoals evenmin gold voor diens voorgangers.

Nvidia heeft de ‘model weights’ beschikbaar gesteld op Hugging Face. Deze waarden zijn cruciaal voor het functioneren van het AI-model, maar er valt nog meer te delen dan dat. Nvidia belooft op den duur namelijk ook de training-code te delen; de inferencing-code is al aanwezig.

Het gebaar van Nvidia voor openheid valt in goede aarde. VentureBeat is bijvoorbeeld vol lof over deze ‘bombshell‘-release van de AI-chipmaker. “Dit besluit [om model weights en code te delen, red.] geeft onderzoekers en ontwikkelaars ongekende toegang tot geavanceerde technologie,” aldus de auteur. Echter gaat het veel te ver om te spreken over een open-source initiatief hier, een suggestie die wel expliciet gemaakt wordt in het artikel in kwestie. Nvidia maakt zelf dankbaar gebruik van open-source middelen om NVLM 1.0 te creëren, van inzichten uit andere AI-modellen tot trainingsdata.

Niemand mag echter NVLM-D-72B commercieel gebruiken. Het model mag ook niet aangepast worden om vervolgens door te verkopen. Dat blijkt uit de licentietermen. Kortom: Nvidia deelt het model alleen voor onderzoeksdoeleinden en recreanten die hun imposante videokaarten op de pijnbank willen leggen. “Open” is dus een slim gekozen term door de onderzoekers. Er valt zeker waarde te halen uit de bevindingen van Nvidia, maar de blokkade tegen commerciële inzet voorkomt dat het echt open-source is. Daar zou alleen sprake van zijn als het vrij mag worden gebruikt, aangepast en gedeeld. Op AI-gebied zijn de grote spelers daar nog absoluut niet aan toe, of het nu OpenAI, Meta, Google, Anthropic of ook Nvidia is.

Lees ook: AI-modellen nog steeds onbetrouwbare code-assistenten