Este o versiune îmbunătățită a actualului V3.1-Terminus, care promite să reducă la jumătate costurile de rulare și să crească viteza de procesare, fără pierderi majore de performanță.
Lansarea marchează un nou pas în misiunea firmei de a face inteligența artificială mai accesibilă și mai eficientă, relatează CNBC.

Noutatea majoră este introducerea DeepSeek Sparse Attention (DSA), o tehnică care permite modelului să gestioneze mai bine documente și conversații lungi, filtrând datele considerate nerelevante. Abordarea sporește eficiența și reduce resursele necesare, însă ridică întrebări legate de fiabilitatea și siguranța rezultatelor, întrucât informații importante ar putea fi excluse, scrie News.ro.
Deși conceptul de ”sparse attention” este discutat în industrie încă din 2015, DeepSeek mizează pe implementarea sa practică și pe compatibilitatea cu cipurile chinezești Ascend și Cambricon, ceea ce permite rularea locală fără infrastructură suplimentară.
În plus, compania a făcut publice codul și instrumentele modelului, încurajând comunitatea să contribuie la dezvoltare.
Analiștii consideră că abordarea DeepSeek ar putea democratiza accesul la AI performant, deschizând calea pentru aplicații inovatoare în companii mai mici sau în cercetare.

Totuși, unii critici atrag atenția că tehnologia, fiind open source și nebrevetabilă, nu oferă un avantaj competitiv solid și ar putea ridica probleme de siguranță și incluziune.
DeepSeek descrie noul model drept o etapă intermediară către o arhitectură de generație următoare, într-un context global în care competiția dintre SUA și China pentru supremația în AI devine tot mai acerbă.