Aplicația a fost lansată acum mai puțin de o lună

Lansată pe 10 ianuarie, aplicația bazată pe modelul DeepSeek-V3 a câștigat rapid popularitate în SUA.

Creatorii săi susțin că acest model „se află în fruntea clasamentului printre modelele open-source și rivalizează cu cele mai avansate modele cu sursă închisă la nivel global”, potrivit datelor furnizate de compania de cercetare Sensor Tower, citată de Reuters.

DeepSeek, un laborator mai puțin cunoscut din China, a reușit să dezvolte modele de inteligență artificială care depășesc performanțele celor mai avansate modele din SUA. Acest lucru a fost realizat în ciuda costurilor reduse și a tehnologiei mai puțin avansate.

În decembrie, compania a prezentat un model de limbaj de mare anvergură, open-source, construit în doar două luni. Costul dezvoltării a fost sub 6 milioane de dolari, folosind cipuri Nvidia H800, mai puțin puternice decât cele de ultimă generație.

Rezultate superioare în teste independente

Modelul DeepSeek a depășit performanțele unor giganți precum Meta, OpenAI și Anthropic în diverse domenii, inclusiv rezolvarea problemelor complexe, matematică și codare.

Luni, compania a lansat r1, un model specializat pe raționament, care a obținut rezultate mai bune decât cel mai recent model OpenAI în numeroase teste.

Cum ar putea arăta motivarea CCR în cazul secretizării declarațiilor de avere. Profesorul de drept Cristian Clipa: „Procurorii nu trebuie să fie serviți ca la restaurant”
Recomandări
Cum ar putea arăta motivarea CCR în cazul secretizării declarațiilor de avere. Profesorul de drept Cristian Clipa: „Procurorii nu trebuie să fie serviți ca la restaurant”

„Modelul celor de la DeepSeek este impresionant, mai ales prin eficiența lor în utilizarea calculului la momentul inferenței. Este un semnal că trebuie să luăm foarte în serios progresele venite din China”, a declarat Satya Nadella, CEO-ul Microsoft într-o intervenție la Forumul Economic Mondial de la Davos.

Depășirea restricțiilor și inovația

Realizările DeepSeek sunt cu atât mai notabile cu cât compania a trebuit să depășească restricțiile stricte impuse de guvernul SUA asupra accesului Chinei la cipuri de înaltă performanță. Acest lucru sugerează fie că laboratorul a găsit metode de a ocoli aceste reguli, fie că măsurile de control nu sunt atât de eficiente cum s-a crezut.

„Au folosit o tehnică numită distilare, prin care un model mare ajută unul mai mic să învețe să devină mai eficient. Este o metodă foarte rentabilă”, a explicat Chetan Puttagunta, partener general la Benchmark.

Alți actori chinezi în cursa AI

DeepSeek nu este singurul actor chinez care avansează în domeniul inteligenței artificiale. Start-upul 01.ai al lui Kai-Fu Lee a fost antrenat cu un buget de doar 3 milioane de dolari.

De asemenea, ByteDance, compania-mamă a TikTok, a lansat recent o actualizare a modelului său, care depășește performanțele modelului o1 de la OpenAI.

Digul subteran din Salina Praid s-a prăbușit. Minerii au încercat până în ultima clipă să salveze o secțiune a minei și au ieșit plângând
Recomandări
Digul subteran din Salina Praid s-a prăbușit. Minerii au încercat până în ultima clipă să salveze o secțiune a minei și au ieșit plângând

„Necesitatea stimulează inovația. Faptul că au fost obligați să găsească soluții alternative i-a condus, de fapt, la construirea unui model mult mai eficient”, a declarat Aravind Srinivas, CEO-ul Perplexity.

Google News Urmărește-ne pe Google News Abonați-vă la canalul Libertatea de WhatsApp pentru a fi la curent cu ultimele informații
Comentează

Loghează-te în contul tău pentru a adăuga comentarii și a te alătura dialogului.