Meta voegt ongeveer twintig nieuwe AI-features toe aan Facebook, Messenger, WhatsApp en Instagram. De meeste functies komen naar de Meta AI-chatbot, zoals het via tekst genereren van afbeeldingen.

De nieuwe functionaliteit voor de Meta AI-chatbot moet de mogelijkheden voor het doorzoeken van het web, via Bing, en het genereren van beelden verder uitbreiden. Bijvoorbeeld kan Meta AI nu meer gedetailleerde antwoorden op vragen vanaf mobiele devices geven, is het aantal zoekvragen dat de Meta AI-chatbot kan verwerken uitgebreid en is het samenvatten van Bing-zoekresultaten verbeterd.

Ook de multimodal-verwerkingsfunctionaliteit van de generatieve AI-chatbot is verbeterd. Meta AI kan nu bijvoorbeeld worden gebruikt om clips te zoeken die in de Facebook Reels-dienst worden gehost.

Imagine-beeldgenerator

Daarnaast kan de ingebouwde Imagine image generator nu bestaande foto’s uploaden en deze met natural language-commando’s bewerken. Imagine wordt straks ook als een gratis stand alone-dienst aangeboden. De met deze dienst gegenereerde beelden krijgen wel een voor het menselijk oog onzichtbaar watermerk voor meer transparantie en traceerbaarheid voor AI-gegenereerde beelden.

De eerste reacties op de Imagine-beelden zijn overigens nog niet helemaal positief. Zo zouden de chatbot de kwaliteit van beelden niet in de buurt komen van Midjourney. Desondanks wordt verwacht dat deze de komende tijd worden verbeterd.

Emu-model met 1,1 miljard trainingsbeelden

De Imagine generatieve AI-applicatie is getraind op het ‘Emu’ AI-model. Dit model maakt het mogelijk afbeeldingen te maken van hoge kwaliteit via een ‘quality tuning’-proces. Traditionele tekst-to-image-modellen worden vooral getraind met grote hoeveelheden ‘image-tekst pairs’. Het EMU-model van Meta doet dit anders. Dit model focust zich op ‘aesthetic alignment’ na pre-training van het model, waarbij een relatief kleine set visueel aantrekkelijke beelden wordt gebruikt.

Wel is de onderliggende dataset erg groot. Volgens Meta draait het Emu-model voor zijn Imagine AI-beeldgenerator op een trainingsset van maar liefst 1,1 miljard beelden in combinatie met een ‘lattent diffusion’-architectuur. Voor AI-modellen met een dergelijke architectuur is de trainingsdataset waarop ze zijn gebouwd verbeterd met een autoencoder.

Waar de voor de grote trainingsset benodigde beelden vandaan komen, is niet bekend. Wel heeft Meta eerder aangegeven dat het posts op zijn social mediaplatforms gebruikt voor het trainen van AI-modellen, zoals het integreren van beelden in het Emu-model.

Meer functionaliteit in 2024

Meta kondigt daarnaast aan dat het in 2024 meer generatieve AI-mogelijkheden introduceert, gefocust op tekstgeneratie en beeldbewerking. Ook wordt een AI-feature getest die helpt aanbiedingen op de Facebook Marktplaats te onderzoeken en ze te vinden.