Chinese startup zet AI en financiële wereld op zijn kop

Deepseek, een jonge Chinese start-up opgericht in 2023, domineert deze week het wereldnieuws. Met hun nieuwe AI-model R1 behalen ze resultaten die de modellen van OpenAI, het bedrijf achter ChatGPT, overtreffen. Het meest verrassende is dat ze dit bereikten met slechts een fractie van de gebruikelijke AI-serverinfrastructuur. Ironisch genoeg viel dit nieuws vrijwel samen met de aankondiging van project Stargate door president Trump, waarin een investering van 500 miljard dollar voor AI-computerinfrastructuur wordt voorzien. Deepseek heeft ChatGPT verdrongen als populairste app. Deze ontwikkeling zorgde voor onrust over het rendement van de enorme AI-investeringen, wat leidde tot een forse beursdaling op maandag waarbij meer dan een biljoen dollar aan beurswaarde verdampte. De cruciale vraag is nu welke blijvende impact Deepseek zal hebben op de ontwikkeling van het AI-domein.

Er is weinig bekend over de grote AI-modellen. De grote technologiebedrijven zijn uiterst terughoudend met informatie over hun modellen en stellen dat dit nodig is om misbruik van de technologie te voorkomen. Een andere mogelijke reden voor deze geheimhouding is de vrees voor juridische gevolgen en reputatieschade als zou uitkomen welke data ze gebruiken, zoals persoonsgegevens of auteursrechtelijk beschermd materiaal, of hoe groot hun ecologische voetafdruk werkelijk is. Volgens onafhankelijke schattingen liggen de kosten voor deze geavanceerde modellen rond de 100 miljoen dollar.

Toen verscheen Deepseek, een jonge Chinese startup die AI-taalmodellen ontwikkelt. Hun nieuwste R1-model presteert op verschillende tests even goed of zelfs beter dan de modellen van OpenAI. En dit voor slechts een fractie van de kosten. Het opmerkelijke is dat deze doorbraak plaatsvond in China, waar Amerika al jaren exportrestricties handhaaft op computerchips om de ontwikkeling van geavanceerde AI-modellen te belemmeren. NVIDIA, dat met een marktaandeel van 90% de AI-chipmarkt domineert, mag zijn meest geavanceerde chips niet naar China exporteren. Deze exportbeperkingen hadden echter een onverwacht effect: doordat Chinese onderzoekers geen toegang hadden tot de nieuwste hardware, werden ze gedwongen creatief om te gaan met de beschikbare middelen. Dit leidde tot het efficiënter trainen van modellen en uiteindelijk tot lagere kosten.

In tegenstelling tot veel Amerikaanse techbedrijven geeft Deepseek openlijk inzicht in hun modellen, die vrij beschikbaar zijn via het online platform HuggingFace. Het R1-model werd in de eerste dagen na lancering al bijna 300.000 keer gedownload. Tot voor kort was open source ook bij Amerikaanse technologiebedrijven de norm voor AI-ontwikkeling. Open source werkt als katalysator omdat iedereen kan bijdragen aan de ontwikkeling. De huidige felle concurrentie tussen deze bedrijven op het gebied van AI-toepassingen heeft deze openheid echter verminderd. Verschillende onderzoekers, ook in de VS, zijn inmiddels aan de slag gegaan met de Deepseek-modellen. Dit kan op termijn gunstig uitpakken voor Chinese bedrijven, waar open source nog steeds de norm is, omdat zij kunnen profiteren van een wereldwijde gemeenschap die hun modellen doorontwikkelt.

De ontwikkeling van Deepseeks efficiëntere modellen roept ernstige vragen op over de duurzaamheid van OpenAI’s bedrijfsmodel. Het bedrijf heeft nog geen winst gemaakt door de enorme kosten voor serverinfrastructuur en kan alleen blijven functioneren dankzij miljarden-investeringen van Microsoft. OpenAI verwacht zelf pas in 2029 winstgevend te worden. Samen met Oracle en NVIDIA lanceerde het bedrijf onlangs het Stargate-project: een investering van 500 miljard dollar in serverinfrastructuur om “het Amerikaanse leiderschap in AI veilig te stellen”. De lancering van Deepseeks R1 werpt echter een nieuw licht op deze gigantische investeringen. Dit wordt treffend geïllustreerd door een video uit 2023 die deze week viraal ging, waarin Sam Altman, CEO van OpenAI, beweerde dat “het totaal hopeloos is om met ons te concurreren” met een budget van ‘slechts’ 10 miljoen dollar.

Deze ontwikkeling zorgde voor onrust bij investeerders, wat resulteerde in een forse daling op de Amerikaanse technologiebeurs. De Nasdaq Composite index zakte maandag met 3,6%, de grootste daling in vijf maanden. Meer dan 1 biljoen dollar aan wereldwijde beurswaarde ging in rook op. NVIDIA, de favoriet van Wall Street, kreeg de zwaarste klap. Het bedrijf had dankzij zijn dominante positie in de hoogwaardige computerchipmarkt enorm geprofiteerd van de AI-boom. Hun aandelen waren in de twee jaar na de lancering van ChatGPT met wel 800% gestegen, waardoor NVIDIA in november 2024 zelfs kortstondig Apple passeerde als waardevolste bedrijf. Op maandag verloor NVIDIA echter 17% van zijn marktwaarde, wat neerkwam op bijna 600 miljard dollar.

Deepseek R1 presteert ook beter dan Amerikaanse modellen in het uitdragen van het socialistische gedachtegoed van de Chinese Communistische Partij. Het model weigert te reageren op vragen over de protesten op het Tiananmenplein in 1989 of vergelijkingen tussen Xi Jinping en Winnie de Pooh. China loopt ook voor op het gebied van AI-regulering. Nieuwe AI-modellen moeten eerst goedkeuring krijgen van de Communistische Partij, die controleert of het model correct omgaat met gevoelige onderwerpen. Deze ontwikkelingen leiden tot zorgen over het wijdverspreide gebruik van de Deepseek-app, met name over mogelijke desinformatie en het potentiële misbruik van gebruikersgegevens door de Chinese overheid.

Kunnen deze kleinere, efficiëntere modellen bijdragen aan het behalen van klimaatdoelstellingen? Veel technologiebedrijven slagen er momenteel niet in hun klimaatdoelen te halen vanwege hun energieverslindende AI-modellen. De Jevons-paradox biedt hierbij een interessant perspectief: wanneer technologie efficiënter wordt, neemt het totale verbruik vaak juist toe in plaats van af. Dit zou kunnen betekenen dat efficiëntere AI-modellen paradoxaal genoeg leiden tot een hogere totale vraag en grotere marktgroei.

Is dit het einde voor het voorheen onaantastbare NVIDIA? Dit lijkt voorbarig, aangezien NVIDIA nog steeds de onbetwiste leider is op het gebied van computerchips. Deepseek maakt bijvoorbeeld ook gebruik van NVIDIA-infrastructuur. De aandelenkoers herstelde zich dinsdag dan ook al deels met een stijging van 9%.

Kan Deepseek de macht van de Amerikaanse Big Tech-bedrijven inperken? De markt voor de grote ‘foundation’-modellen is opengebroken nu het mogelijk is om zeer capabele modellen te ontwikkelen met beperkte middelen. De enorme investeringen die voorheen noodzakelijk leken, waren slechts voor een kleine groep weggelegd. Nu blijkt dat dit kan voor een fractie van de kosten, waardoor er plotseling veel meer potentiële spelers zijn. Deze Chinese doorbraak in de mondiale AI-race zou ook Europese organisaties kunnen helpen om hun eigen modellen te ontwikkelen.

Vond je deze post interessant?