Itt az új DeepSeek R1
A kínai DeepSeek startup, amely idén komoly hullámokat kavart a piacokon, csendben kiadta mesterséges intelligencia okfejtő modelljének újabb, fejlettebb verzióját. Hivatalos bejelentést nem tettek, helyette a model frissítése feltűnt a Hugging Face nevű AI modellek nyílt forráskódú tárhelyén. Ez a platform kiemelten fontos a fejlesztők számára az új MI modellek bemutatásához és teszteléséhez.
DeepSeek idén azzal szerzett hírnevet, hogy ingyenes, nyílt forráskódú R1 okfejtő modellje túlteljesítette több riválisát, köztük a Meta és az OpenAI megoldásait. A modell gyors és olcsó fejlesztése világszinten megdöbbenést okozott, mivel rámutatott arra, hogy az amerikai technológiai óriások, mint például az Nvidia, talán a kelleténél többet költenek infrastruktúrára. Ez több milliárd dollár veszteséget eredményezett egyes amerikai technológiai részvényeknél – különösen az AI-piac meghatározó szereplőjénél, az Nvidia-nál (NVDA is a tőzsdén a szimbóluma).
A piacok azóta részben helyreálltak, de a DeepSeek új modelljét ugyanúgy kevés felhajtás mellett jelentették meg, mint az előzőt. Ez az okfejtő modell képes összetettebb feladatokat lépésről lépésre, logikus gondolkodás útján teljesíteni – az ilyen típusú modellek előnye, hogy struktúrált, átgondolt választ képesek adni bonyolult kérdésekre is.
Az új, továbbfejlesztett DeepSeek R1 modell teljesítménye közvetlenül az OpenAI legújabb o4-mini és o3 okfejtő modelljei mögött helyezkedik el a LiveCodeBench nevű tesztoldal rangsorában. A LiveCodeBench egy olyan weboldal, ahol különböző MI modelleket mérnek össze többféle teljesítménymutató alapján.
A DeepSeek mára a kínai mesterséges intelligencia szimbólumává vált, amely annak ellenére is fejlődik, hogy az Egyesült Államok – az amerikai Tőzsdefelügyelet, az SEC irányításával – igyekszik korlátozni Kína hozzáférését csipekhez és más fejlett technológiákhoz. A kínai technológiai óriások, például a Baidu és a Tencent idén júniusban már bemutatták, hogyan teszik AI modelljeiket hatékonyabbá, hogy megfeleljenek az amerikai félvezető exportkorlátozásoknak.
Fontos kiemelni, hogy az Nvidia vezérigazgatója, Jensen Huang is bírálta az amerikai exportkontrollt. Az Nvidia az egyik vezető grafikus processzor (GPU) gyártó, melyek kulcsfontosságúak a mesterséges intelligencia modellek tanításához. Huang úgy fogalmazott: "Az USA politikája azon a feltételezésen alapult, hogy Kína nem tud AI csipeket gyártani. Ez a feltételezés mindig is kétséges volt, és most már világosan tévesnek bizonyult."
Végül Huang hozzátette: "A kérdés nem az, hogy Kínának lesz-e mesterséges intelligenciája. Már van neki." Ez jól mutatja, hogy hiába a különféle korlátozások, a kínai fejlesztők továbbra is jelentős lépéseket tesznek az MI fejlesztésében, és újraírhatják az erőviszonyokat a globális AI piacon.
Forrás