
DeepSeek-R1, een nieuw groot taalmodel van het Chinese AI-bedrijf DeepSeek, met een website die oogt alsof een slaapdronken stagiair te vroeg op ‘enter’ drukte, heeft wereldwijd aandacht getrokken als een kosteneffectief en open alternatief voor OpenAI’s vlaggenschip o1. Uitgebracht op 20 januari, al dan niet toevallig in het weekend dat ’tout Silicon Valley’ gretig in Washington tegen de macht aanschurkte, blinkt R1 uit dankzij “chain of thought”-redenering, die het probleemoplossend vermogen van mensen nabootst.
In tegenstelling tot gesloten modellen zoals o1 van OpenAI en Claude van Anthropic, dat snel nog twee miljard dollar ophaalde van investeerders die op AI-gebied met pudding tegen de muur smijten in de hoop dat er wat blijft kleven, is R1 open-weight en gepubliceerd onder een MIT-licentie. Dat betekent dat het een ieder vrij staat om voort te bouwen op de architectuur. In tegenstelling tot bij open-sourcezijn de broncode en trainingsdata waarmee DeepSeek-R1 werd gebouwd niet openbaar,
Het model werd ontwikkeld voor slechts vijf miljoen dollar door middel van algoritmische efficiëntie en reinforcement learning, aanzienlijk minder dan o1, ondanks Amerikaanse exportbeperkingen op geavanceerde GPU-chips, vooral van Nvidia, waarop de Amerikaanse concurrenten ontwikkelen. Dankzij de betaalbaarheid, met API-kosten die meer dan negentig procent lager liggen dan die van o1, wordt geavanceerde AI zo toegankelijker voor onderzoekers met beperkte middelen. Het biedt ook een gratis chatbot-interface met zoekmogelijkheden op het web, waarmee het OpenAI’s huidige functies overtreft.
‘Everyone is freaking out about DeepSeek’
Door o1 te evenaren of zelfs te overtreffen in sommige benchmarks heeft R1 de opmars van China in AI-ontwikkeling voor het voetlicht gebracht. De plotselinge opkomst van het model heeft discussies op gang gebracht over de toekomst van open, toegankelijke AI en de noodzaak van internationale samenwerking om op verantwoorde wijze verder te ontwikkelen.
De internationale reacties op DeepSeek-R1 varieerden van respect tot ontzetting. Nature was analytisch: ‘DeepSeek-R1 performs reasoning tasks at the same level as OpenAI’s o1 — and is open for researchers to examine.’ MIT Technology Review bleef netjes: ‘The AI community is abuzz over DeepSeek R1, a new open-source reasoning model.’ Maar VentureBeat zei hardop wat heel Silicon Valley dacht: ‘Why everyone in AI is freaking out about DeepSeek.’
Wie DeepSeek overigens vraagt naar Tiananmen Square krijgt als antwoord: ‘I am sorry, I cannot answer that question. I am an AI assistant designed to provide helpful and harmless responses.’ Gevraagd naar de situatie van de Oeigoeren (Uyghurs) verscheen eerst een zeer uitgebreid antwoord dat zelfs het woord genocide gebruikte, maar een paar seconden later werd die tekst vervangen door: ‘Sorry, that’s beyond my current scope. Let’s talk about something else.’ DeepSeek wil het vooral gezellig houden.
Stargate historisch project in AI-infrastructuur
De aandacht voor het Chinese DeepSeek leidde tot groot chagrijn van de Amerikaanse techno-elite, die deze week juist wilde aangrijpen om de Amerikaanse suprematie te onderstrepen. OpenAI, Oracle, het Japanse SoftBank en MGX uit de Emiraten financieren het Stargate Project, een initiatief van vijfhonderd miljard dollar dat wordt beschreven als het grootste AI-infrastructuurproject in de geschiedenis.
Aangekondigd door president Donald Trump in de Oval Office, is het doel van de onderneming om geavanceerde datacenters voor AI te bouwen in de VS, wat volgens Trump honderdduizend banen zal creëren. Het zijn een soort Delta-werkenvoor AI. Het project beschikt momenteel over honderd miljard dollar aan directe financiering, terwijl de resterende investering over vier jaar wordt verspreid. Het eerste enorme datacenter wordt gebouwd in Texas.
Het leidde alweer tot gehakketak over de financiering van Stargate tussen OpenAI-CEO Sam Altman en Elon Musk. Forbes heeft zelfs een timeline gemaakt van de voortdurende fitties tussen Altman en Musk, die samen eens een boksring of een hotelkamer moeten opzoeken.
Wil het echte MGX opstaan
In alle opwinding was het vooral komisch dat beleggers en masse het verkeerde aandeel kochten in de veronderstelling dat het deel uitmaakt van Stargate: biotechbedrijf Metagenomi (symbool: MGX) zag de koers door het dak gaan, terwijl het niet is betrokken bij Stargate. Het MGX dat wel deelneemt aan Stargate, het staatsfonds van Abu Dhabi, deze MGX, zal het met verwondering hebben aangezien.
Het zou knap zijn als Trump erin slaagt om met MGX en het Japanse Softbank buitenlandse investeerders honderden miljarden in Amerikaanse infrastructuur te laten investeren, zonder dat de Amerikaanse belastingbetaler meebetaalt. Investeerder Bill Gurley (Uber) zette publiekelijk zijn vraagtekens bij de voor Amerikaanse begrippen vreemde publiek-private samenwerking. De vraag is vooral of Stargate toegankelijk wordt voor iedereen en wie uiteindelijk de beslissingen neemt. OpenAI-CEO Sam Altman heeft vaker problemen met governance.
OpenAI met AI-agent: Operator
In alle ophef over DeepSeek en Stargate sneeuwde onder dat OpenAI deze week Operator heeft geïntroduceerd, een AI-agent die zelfstandig door webbrowsers kan navigeren en taken kan uitvoeren zoals online winkelen, het boeken van reizen en het maken van reserveringen. Het markeert het moment dat AI-agents hun intrede doen op de massamarkt.
Operator maakt gebruik van het Computer-Using Agent (CUA)-model van OpenAI, dat menselijke interacties met websites nabootst door knoppen, menu’s en formulieren te gebruiken. OpenAI werkt voor Operator samen met bedrijven zoals DoorDash, Uber en eBay om te zorgen dat het voldoet aan hun gebruiksvoorwaarden.
Ondanks alle potentie heeft Operator beperkingen met complexere taken zoals bankieren en complexe web-interfaces of CAPTCHA’s. Op dit moment is het helaas alleen nog beschikbaar voor Amerikaanse gebruikers op het ChatGPT Pro-abonnement van tweehonderd dollar per maand, dus ik heb het zelf nog niet kunnen testen.
Operator een echo van General Magic
OpenAI’s Operator doet bijna vijfendertig jaar na dato sterk denken aan het legendarische bedrijf General Magic, bekend van de kreet ’the most important company to ever come out of Silicon Valley that nobody ever heard of.’ Alle marketingteksten van Operator lijken een kopie van de slogans en claims van General Magic uit begin jaren negentig.
Uiteindelijk bleek General Magic, dat probeerde een handheld computer te maken met agent-functies voordat internet en digitale mobiele telefonie bestonden, zijn tijd te ver vooruit. Net als General Magic streeft Operator ernaar om naadloos te integreren in het leven van gebruikers en te functioneren als een persoonlijke assistent en productiviteits-verhoger.
Voor de liefhebbers: er is een mooie documentaire gemaakt over opkomst en ondergang van General Magic, waarvan dit de trailer is. Het team achter General Magic was zo bijzonder, dat er tientallen boeken zijn verschenen en zelfs een heuse speelfilm is gemaakt waarin zij een hoofdrol vertolken: Andy Hertzfeld was een prominent lid van het team dat voor Steve Jobs de Apple Macintosh ontwikkelde, Tony Fadell werd na General Magic bij Apple de ontwikkelaar van de iPod en mede-schepper van de iPhone en Joanna Hoffman is zo’n bijzonder mens, dat Kate Winslet er alle moeite voor deed om haar te mogen spelen in de film over Steve Jobs van Danny Boyle.
Leike en Hinton met verschillende waarschuwingen
In alle publiciteit over DeepSeek, Stargate en AI-agents sneeuwde onder dat twee vooraanstaande AI-wetenschappers opnieuw waarschuwden voor verkeerd gebruik van AI met mogelijke rampzalige gevolgen voor de wereld. Professor Geoffrey Hinton, een vooraanstaande figuur in AI en winnaar van de Nobelprijs voor natuurkunde in 2024, besprak de risico’s van snelle AI-ontwikkelingen in een fascinerend gesprek met zijn voormalige student Curt Jaimungal.
Hinton waarschuwde al vaker dat AI zou kunnen evolueren en de motivatie kunnen krijgen om meer van zichzelf te maken en autonoom een subdoel te kunnen ontwikkelen om controle te krijgen over de wereld, zonder rekening te houden met mensen.
De Duitser Jan Leike, mede-oprichter van OpenAI waar hij zonder plichtplegingen de deur achter zich dichtsloeg, zegt het nu als volgt:: “Probeer geen monster op te sluiten, maar bouw iets dat je echt kunt vertrouwen!” Eerder schreef ik uitgebreid over de waarschuwingen van Leike en Hinton in deze blogpost.