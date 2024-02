De maker van ChatGPT heeft een model ontwikkeld dat op basis van tekst video’s van een minuut lang kan maken.

Sora is in staat om op basis van een tekstuele prompt of een stilstaand beeld een video te creëren van maximaal een minuut, met een videokwaliteit van 1080p. De prompt van de gebruiker wordt nauwkeurig gevolgd. In het gegenereerde filmpje kunnen meerdere karakters en achtergronddetails worden opgenomen. Het model is tevens in staat bestaande videoclips uit te breiden door missende details toe te voegen.

“Het model heeft een diep begrip van taal, waardoor het aanwijzingen nauwkeurig kan interpreteren en boeiende karakters kan genereren die levendige emoties uitdrukken. Sora kan ook meerdere shots maken binnen één enkele gegenereerde video, waarbij de karakters en visuele stijl nauwkeurig worden weergegeven”, licht OpenAI toe. Op de website van OpenAI zijn ook video’s te zien die Sora gegenereerd heeft.

Optimaliseren Sora

OpenAI geeft aan dat Sora niet perfect is. Zo kan het model moeite hebben met het nauwkeurig simuleren van de fysica van een complexe scène. Ook begrijpt het mogelijk sommige gevallen van oorzaak en gevolg niet goed. Een voorbeeld: een persoon neemt een hap uit een koek, maar daarna is het mogelijk dat de koek geen bijtafdruk heeft.

OpenAI blijft het model verder ontwikkelen, waardoor bovenstaande beperkingen mogelijk op termijn verdwijnen. Sora vertrouwt ook op onderzoek van OpenAI uit DALL-E, het model van het bedrijf dat afbeeldingen kan genereren op basis van prompts.

Vooralsnog is Sora beperkt beschikbaar. Red teams kunnen ermee aan de slag om mogelijke problemen op te sporen. Daarnaast krijgt een beperkt aantal visuele professionals, designers en filmmakers toegang, zodat zij feedback kunnen geven over het verder geschikt maken van het model voor creatievelingen.

