Nvidia bundelt spraak, beeld en tekst in nieuw AI-model

Nvidia presenteert een nieuw AI-model dat meerdere vormen van input in één systeem samenbrengt. Met de introductie van Nvidia Nemotron 3 Nano Omni zet het bedrijf in op zogeheten multimodale AI. Hierbij worden tekst, audio en visuele informatie gelijktijdig verwerkt.

Het model is ontworpen voor inzet in AI-agents die zelfstandig taken uitvoeren. Volgens de aankondiging moet de combinatie van verschillende datastromen ervoor zorgen dat zulke systemen beter kunnen redeneren en context begrijpen. In plaats van afzonderlijke modellen voor spraak, beeld en tekst te gebruiken, probeert Nvidia deze functies te integreren in één architectuur.

Nemotron 3 Nano Omni valt op doordat het relatief compact is in vergelijking met grotere multimodale modellen. Het bedrijf richt zich daarmee op toepassingen waarbij efficiëntie en inzetbaarheid in productieomgevingen centraal staan. Ontwikkelaars kunnen het model aanpassen aan specifieke use-cases, wat aansluit bij een bredere trend waarin bedrijven meer controle willen over hun AI-infrastructuur.

De integratie van meerdere modaliteiten moet processen vereenvoudigen. In praktijksituaties kan dat betekenen dat een systeem bijvoorbeeld geluidsfragmenten, documenten en videobeelden tegelijk analyseert zonder dat daar aparte pipelines voor nodig zijn. Dat kan de complexiteit van implementaties verminderen en mogelijk ook de latency verlagen.

Prestaties en claims nog te verifiëren

Volgens Nvidia is het model geoptimaliseerd voor prestaties bij dergelijke gecombineerde taken. Daarbij wordt gewezen op verbeteringen in snelheid en nauwkeurigheid ten opzichte van eerdere generaties. Onafhankelijke benchmarks en bredere evaluaties zullen moeten uitwijzen in hoeverre die claims standhouden in verschillende toepassingen.

De introductie van Nemotron 3 Nano Omni past in een bredere ontwikkeling waarin AI-modellen steeds vaker multimodaal worden. Grote technologiebedrijven investeren in systemen die niet langer beperkt zijn tot één type input, maar meerdere informatiebronnen combineren om tot betere resultaten te komen. Met dit model probeert Nvidia zich nadrukkelijk in dat speelveld te positioneren, met een focus op praktische inzetbaarheid in plaats van uitsluitend schaal.

Lees meer over Applications

Topartikel

Weer paniek om Chinees AI-model, weer slaat die paniek door

Wall Street is hardleers. Toen begin vorig jaar de aandelen van allerlei techbedrijven hard omlaag gingen, we...

Erik van Klinken 17 juli 2026

1.178 AI-medewerkers willen rem op ontwikkeling frontier AI

Meer dan 1.100 medewerkers van de grootste AI-bedrijven ter wereld roepen de Amerikaanse overheid op om inter...

Mels Dees 9 uren geleden

Topartikel

Het probleem met AI model routing

Tokenmaxxing is grotendeels een stille dood gestorven. Het is tot bedrijven doorgedrongen dat ranglijsten die...

Erik van Klinken 6 juli 2026

IFS ziet omzet 25 procent groeien door AI in industriële omgevingen

De jaarlijks terugkerende omzet van IFS groeide in de eerste helft van 2026 met 25 procent. IFS koppelt die s...

Berry Zwets 7 uren geleden

Expert aan het woord

Tech calendar

Nvidia bundelt spraak, beeld en tekst in nieuw AI-model

Prestaties en claims nog te verifiëren

Blijf op de hoogte, abonneer!

Google geeft AGI voorrang op cloudklanten bij inzet eigen AI-chips

Paniek rond start productie ASML-alternatief in China

Het water- en energieverbruik van datacenters in de juiste context

Helios: AMD groeit naar rack-scale AI-systeem

Solo.io reveals how to manage AI agents across any platform

Why hyperscalers run containers in VMs: VKS deep dive

SAP executive addresses API policy and openness concerns

How New Orleans monitors 2,000+ cameras in real time

AI in cybersecurity: van ondersteuning naar samenwerking

Een AI-agent die in negen seconden een productiedatabase wiste: vijf lessen

ODC-Noord: bouwstenen voor een overheidscloud die al draait

Cyberoperatie INTERPOL en Fortinet legt nieuwe vormen van online mensenhandel bloot

Dreamforce

GOTO Copenhagen 2026

NetApp INSIGHT 2026

Manhattan EMEA Exchange

Cyberrisico’s zetten bedrijfscontinuïteit het meest onder druk

Hoe bouw je veilig agentic AI-applicaties in enterprise-omgevingen?

De opkomst van de Managed Intelligence Provider

Hoe zet je AI veilig in binnen applicatieontwikkeling?