DeepSeek daagt OpenAI uit met gratis AI-model: wat zit onder de motorkap?
Het Chinese AI-bedrijf DeepSeek heeft onlangs een reeks krachtige, openbaar beschikbare machine learning-modellen gelanceerd die concurreren met OpenAI's o1-model. DeepSeek, opgericht in 2023 door ondernemer Liang Wenfeng en gefinancierd door zijn hedgefonds High Flyer, claimt dat zijn modellen niet alleen de prestaties van OpenAI evenaren, maar dit ook tegen een fractie van de kosten hebben bereikt. The Register is ingedoken in de technologische toepassingen van AI-chatbot uit China.
Het vlaggenschipmodel, DeepSeek V3, werd getraind met 14,8 biljoen tokens op 2.048 Nvidia H800-GPU's, wat neerkomt op ongeveer 2,78 miljoen GPU-uren en een geschatte kostenpost van 5,58 miljoen dollar. Het nieuwste model, R1, is een "reasoning model" dat is afgestemd op V3 en gebruikmaakt van reinforcement learning en chain-of-thought (CoT) redenering. Dit betekent dat het model vragen in stappen beantwoordt, waardoor het logischer en nauwkeuriger antwoorden kan genereren.
DeepSeek beweert dat R1 presteert op het niveau van OpenAI's o1 en deze zelfs overtreft in bepaalde benchmarks, zoals de MATH-500-test. Bovendien is een kleinere variant van het model, met slechts 32 miljard parameters, beschikbaar onder de MIT-licentie op Hugging Face, waardoor gebruikers het gratis kunnen downloaden en lokaal op hun pc kunnen gebruiken.
Gratis webinterface
Voor wie het model niet lokaal wil draaien, biedt DeepSeek een goedkopere cloud-API en een gratis webinterface aan. Wel waarschuwt het bedrijf dat gebruikersdata en gesprekken worden opgeslagen in China, wat privacyvragen oproept.
DeepSeek's opmars zet vraagtekens bij de enorme investeringen van westerse techgiganten zoals Meta, OpenAI en Microsoft, die tientallen miljarden dollars uitgeven aan AI-ontwikkeling. Met zijn efficiënte en kosteneffectieve aanpak dreigt DeepSeek de AI-markt te verstoren en de dominantie van Amerikaanse bedrijven uit te dagen.