IBM introduceert Granite 4-taalmodellen

IBM heeft een nieuwe generatie open-source taalmodellen uitgebracht onder de naam Granite 4. De serie combineert twee neurale netwerkarchitecturen en moet betere prestaties leveren met minder geheugengebruik.

De Granite 4-familie bestaat bij de lancering uit vier modellen met omvang tussen 3 en 32 miljard parameters. Volgens IBM presteren ze efficiënter dan eerdere generaties, dankzij een hybride opzet waarin de Transformer-architectuur wordt gecombineerd met Mamba, een nieuwe en hardwarezuinige netwerkstructuur.

Een van de kleinere modellen, Granite-4.0-Micro, gebruikt uitsluitend de Transformer-aanpak. Deze staat bekend om het attention-mechanisme, waarmee het model de belangrijkste delen van een tekst selecteert en prioriteert. De drie andere modellen voegen hier elementen van de Mamba-architectuur aan toe. Mamba biedt vergelijkbare mogelijkheden, maar gebruikt daarvoor een wiskundig systeem genaamd een state space model, oorspronkelijk ontwikkeld voor ruimtevaarttoepassingen.

Lagere geheugendruk

Een voordeel van Mamba is de lagere geheugendruk bij lange invoerprompts. Waar het geheugengebruik van een Transformer snel toeneemt, blijft dat bij Mamba beperkt. Dit maakt de modellen goedkoper en sneller, vooral nuttig bij real-time toepassingen of op lichtere hardware.

De Granite 4-serie is gebouwd op de nieuwste versie van de Mamba-architectuur, Mamba 2. Deze is compacter en efficiënter, waardoor minder hardware nodig is voor dezelfde berekeningen. Het grootste model, Granite-4.0-H-Small, telt 32 miljard parameters en gebruikt een mixture-of-experts-ontwerp waarbij slechts een deel van de parameters wordt geactiveerd. IBM ziet hierin een geschikte oplossing voor geautomatiseerde klantenondersteuning.

De twee kleinere hybride modellen, Granite-4.0-H-Tiny en Granite-4.0-H-Micro, beschikken over 7 miljard en 3 miljard parameters. Ze zijn bedoeld voor toepassingen waarin snelheid belangrijker is dan maximale nauwkeurigheid.

Volgens IBM verbruikt Granite-4.0-H-Tiny veel minder geheugen dan zijn voorganger, Granite 3.3 8B. In interne tests gebruikte het model slechts een zesde van het RAM-gebruik, terwijl de uitvoerkwaliteit verbeterde. Een IBM-onderzoeker verklaarde dat de efficiëntie van de nieuwe architectuur slechts deels de vooruitgang verklaart; vooral verfijnde trainingsmethoden en een groter trainingscorpus dragen bij aan de betere prestaties.

Granite 4 is beschikbaar via IBM’s watsonx.ai-platform en via externe diensten zoals Hugging Face. IBM wil de modellen later ook aanbieden via Amazon SageMaker JumpStart en Microsoft Azure AI en plant uitbreiding met nieuwe varianten met geavanceerdere redeneervermogen.

Lees meer over Applications

Expert aan het woord

IBM introduceert Granite 4-taalmodellen

Lagere geheugendruk

Blijf op de hoogte, abonneer!

Google lanceert Gemini 3.1 Pro, een LLM voor complexe redenaties

Licentiechaos Oracle en SAP: Weet wat je hebt voordat je overstapt

Anthropic Claude versnelt COBOL-modernisering met AI

IT-security in de zorg hoeft geen zorgenkindje te zijn

Why this CIO ditched Microsoft for Google and Slack

Workday Rising EMEA: platform transformation: Pipedream, AI agents and sovereignty

NetSuite founder reveals AI transformation 5 years in the making

AI data centers: the road to 1 megawatt per rack explained

Van huddle tot boardroom: hoe ClickShare vergaderen herdefinieert

De balans tussen AI-innovatie en de EU AI Act

Hoe Nokia wereldwijde netwerklabs inzet voor AI-ready infrastructuur

Bestrijd de volgende evolutie van e-maildreigingen met gelaagde, AI-gedreven beveiliging

Appdevcon

Webdevcon

Dutch PHP Conference

De IT Afdeling van de toekomst

GITEX ASIA 2026

Southeast Asia AI Application Summit 2026

Platform engineering als versneller van de energietransitie

Het pakketprobleem in de logistiek; van claims naar kostenbesparing

Axis maakt met camerasensors de werkomgeving veiliger en efficiënter