Tencent onthult Hunyuan Video. Dit is een gratis en open-source AI-videogenerator, strategisch uitgebracht tijdens OpenAI’s 12-daagse aankondigingscampagne, waarin het naar verwachting Sora, de langverwachte videotool, introduceert.
“Wij presenteren Hunyuan Video, een nieuw open-source video-basismodel dat prestaties in topkwaliteit levert die vergelijkbaar zijn met, of beter dan, toonaangevende gesloten modellen,” zei Tencent in de officiële aankondiging, die Decrypt citeert.
Het in Shenzhen, China gevestigde techbedrijf beweert dat zijn model “beter presteert” dan Runway Gen-3, Luma 1.6, en “drie topmodellen uit China” op basis van professionele menselijke evaluaties. Hunyuan Video gebruikt een decoder-only multimodaal groot taalmodel als tekstencoder, in plaats van de gebruikelijke CLIP- en T5-XXL-combinatie die andere AI-video- en beeldgenerators gebruiken.
Geen extra training nodig
Volgens Tencent helpt dit het model om instructies beter op te volgen, beelddetails nauwkeuriger te begrijpen en nieuwe taken on-the-fly te leren zonder extra training. Bovendien krijgt zijn causale aandachtssysteem een boost door een speciale token-refiner, waardoor het prompts grondiger begrijpt dan traditionele modellen.
Het model herschrijft prompts ook om deze rijker te maken en de kwaliteit van de generaties te verhogen. Een simpele prompt zoals “Een man die zijn hond uitlaat” kan bijvoorbeeld worden uitgebreid met details over de scène, lichtomstandigheden, kwaliteit, en meer.
Vrij beschikbaar voor iedereen
Net als Meta’s Llama 3 is Hunyuan gratis te gebruiken en te monetizen tot je de grens van 100 miljoen gebruikers bereikt — een drempel waar de meeste ontwikkelaars niet snel mee te maken krijgen.
De voorwaarde? Je hebt een krachtige computer nodig met minstens 60GB GPU-geheugen om het 13 miljard parameter model lokaal te draaien — denk aan Nvidia H800- of H20-kaarten. Dat is meer videogeheugen dan de meeste gaming-pc’s hebben.
Voor gebruikers zonder supercomputer bieden clouddiensten al ondersteuning. Platforms zoals FAL.ai hebben Hunyuan geïntegreerd en rekenen $0,5 per video. Andere aanbieders, zoals Replicate of GoEhnance, bieden eveneens toegang tot het model. De officiële Hunyuan Video-server biedt 150 credits voor $10, waarbij een video minimaal 15 credits kost.
Eerste tests tonen dat Hunyuan qua kwaliteit vergelijkbaar is met commerciële zwaargewichten zoals Luma Labs Dream Machine of Kling AI. Het genereren van een video duurt ongeveer 15 minuten en produceert fotorealistische scènes met natuurlijk ogende bewegingen van mensen en dieren.