Storing treft DeepSeek, dat OpenAI op de hielen zit

Storing treft DeepSeek, dat OpenAI op de hielen zit

DeepSeek reurt de techindustrie. Nadat het vriend en vijand verbaasde met het ‘redenerende’ model R1, heeft het ook een competitieve AI-afbeeldingenmaker geïntroduceerd: Janus-Pro. Toch moet het Chinese bedrijf snel leren hoe het is om populair te zijn. De dienst gaat namelijk al gebukt onder cyberaanvallen “op grote schaal”.

DeepSeek heeft aanmeldingen voor de chatbotdienst (via chat.deepseek.com) tijdelijk gepauzeerd. Wie al een account heeft, kan echter wel aan de slag. Op de statuspagina zijn de laatste updates te zien. Een saillant detail is dat die pagina praktisch identiek is aan OpenAI’s equivalent, aangezien ze beide op Atlassian Statuspage draaien.

Horde te nemen

Een storing valt te verwachten bij een dienst die zo explosief is gegroeid. DeepSeek is in een week tijd van een voor velen obscure speler naar nr. 1 op de Amerikaanse App Store gestegen. De meeste gebruikers zullen niet het open-source model via HuggingFace of GitHub raadplegen of lokaal draaien, maar gebruikmaken van de DeepSeek AI Assistant-app. Aangezien niemand de opmars van DeepSeek aan heeft zien komen, is het goed mogelijk dat het opschalen van de dienst nu een hels karwei wordt. Wegens exportrestricties van Nvidia-chips zal het Chinese bedrijf wellicht diep in de grabbelton moeten zoeken voor extra capaciteit. Desondanks is het harde werk, de AI-training, al verricht: AI-inferencing (het ‘draaien’ van het AI-model) door miljoenen gebruikers kost veel minder rekenkracht.

Het is onduidelijk wie er achter de aanvallen zit. Als we een beetje grappend mogen speculeren, kunnen er best DDoS’ende aandeelhouders van Nvidia tussen zitten. Net als andere techbedrijven moest die partij het gisteren op de beurs ontgelden, met een historisch verlies van circa 600 miljard dollar (!) ofwel bijna 17 procent aan marktwaarde tot gevolg. Broadcom maakte het nog bonter met een procentueel verlies van 17,4 procent. De schrik zit er goed in bij de AI-concurrenten. Het voornaamste doelwit is OpenAI, dat met het eigen model o1 een troef in handen dacht te hebben die nu met DeepSeek-R1 bijna wordt geëvenaard.

Wil je meer weten over DeepSeek? Luister dan onze Techzine Talks-aflevering (tekst gaat verder hieronder) of lees de gekoppelde blog:

Visiemodel

Alsof OpenAI niet al genoeg had om wakker over te liggen, heeft DeepSeek nu ook Janus-Pro onthuld. Het is wederom een open-source AI-model, maar in dit geval multimodaal en gericht op visuele generatie. Oftewel: een AI-afbeeldingenmaker, net als OpenAI’s DALL-E 3 en Stable Diffusion van Stability AI. Het is uitgebracht onder de MIT-licentie, dus andere bedrijven mogen er een commercieel product omheen bouwen.

De resolutie van Janus-Pro voor inputs is echter zeer beperkt: 384×384. Desondanks claimt DeepSeek opnieuw dat het eigen model competitief is met de grootste spelers op de AI-markt in benchmarks. Hier is niet sprake van een vergelijkbare schok als er met DeepSeek-R1 plaatsvond. Visiemodellen zijn er in allerlei vormen en de outputs van Janus-Pro zijn niet op alle fronten kwalitatief hoogstaand. Toch is het opnieuw een herinnering aan Amerikaanse AI-bedrijven dat ze voortaan enorm rekening moeten houden met wat DeepSeek kan bereiken. En dat niet alleen, want elke open-source AI-ontwikkelaar kan er lering uit trekken.

Muren geslecht

DeepSeek heeft deze week zich geïntroduceerd aan de wereld. Het duurde ongeveer een week voordat de onthulling van het R1-model de wijdere wereld en Wall Street in het bijzonder bereikte. Van een ‘ChatGPT-moment’ is niet sprake, want de innovatie draait hier niet om een geheel nieuw kwaliteitsniveau van GenAI. Echter plaatst dit uiterst efficiënte en open model OpenAI in haar moeilijkste positie sinds het ChatGPT introduceerde. De releases van Google Bard (later Gemini), Claude, de uitrol van Microsoft’s Copilot-suite, AI-agents en een veelvoud aan andere uitdagers wisten niet door te dringen tot de kern van OpenAI’s voorsprong. Sinds eind 2022 heeft het de grootste groep gebruikers gekend en kon het altijd een prijzig, top-of-the-line AI-model via een API beschikbaar stellen.

Mogelijk volgt een nog belangrijker moment: wat als DeepSeek immers de eigen bevindingen opschaalt naar een groter model dan 671 miljard parameters? Of wat als een concurrent als Meta, Anthropic of Google dezelfde lessen vertaalt naar de eigen LLM’s?

Het kan ook gewoon OpenAI zijn dat de volgende stap maakt. Haar CEO Sam Altman noemt DeepSeek in ieder geval “een indrukwekkend model”. Maar: “We zullen natuurlijk veel betere modellen leveren en het is ook legitiem stimulerend om een nieuwe concurrent te hebben! We zullen wat releases naar voren brengen.”