DeepSeek, startup-ul chinez de inteligență artificială, a lansat o previzualizare a seriei sale de modele V4, marcând cea mai recentă iterație a gamei sale de modele lingvistice de mari dimensiuni. Anunțul introduce două variante în cadrul seriei, denumite V4-Pro și V4-Flash, ambele concepute pentru a echilibra performanța, eficiența și costurile în funcție de nevoile de implementare.
Conform dezvăluirilor tehnice ale companiei, modelul V4-Pro este configurația mai capabilă, construită cu aproximativ 1,6 trilioane de parametri totali și 49 de miliarde de parametri activi. Este descris ca oferind performanțe care se apropie de sistemele closed-source de top, în special în domenii precum recuperarea cunoștințelor globale, raționamentul, matematica, programarea și sarcinile STEM.
În evaluările comparative la care face referire dezvoltatorul, se spune că V4-Pro conduce modelele open-source actuale pe mai multe benchmark-uri, situându-se în urma doar a Gemini 3.1 Pro de la Google în evaluările legate de cunoștințe.
A doua variantă, V4-Flash, este prezentată ca o alternativă mai ușoară și mai rentabilă, conținând aproximativ 284 de miliarde de parametri totali și 13 miliarde de parametri activi. Deși mai mică ca dimensiune, se raportează că menține o paritate apropiată cu versiunea Pro pe sarcini mai simple bazate pe agenți, oferind în același timp timpi de răspuns mai rapizi și costuri operaționale reduse. Această configurație este poziționată pentru aplicații cu debit ridicat unde eficiența este prioritizată față de capacitatea maximă a modelului.
DeepSeek a subliniat, de asemenea, modificările structurale și arhitecturale introduse în seria V4, inclusiv noi mecanisme de atenție care combină compresia la nivel de token cu tehnici de atenție sparse. Aceste ajustări sunt menite să îmbunătățească eficiența procesării contextului lung, reducând în același timp cerințele de calcul și memorie. Compania notează că o fereastră de context de un milion de token-uri a devenit standard în cadrul serviciilor sale, reflectând o tendință mai largă spre gestionarea contextului extins în modelele la scară largă.
Un alt punct de interes al lansării este funcționalitatea orientată spre agenți. Sistemul V4 a fost optimizat pentru compatibilitate cu ecosistemele externe de instrumente AI, inclusiv framework-uri precum Claude Code și OpenClaw, precum și alte medii de dezvoltare bazate pe agenți. Modelul este descris, de asemenea, ca fiind utilizat activ în fluxurile de lucru interne de programare agentică.
Atât V4-Pro, cât și V4-Flash sunt disponibile prin acces API, suportând multiple standarde de integrare și moduri operaționale duale. Compania a indicat că modelele moștenite vor fi eliminate treptat în favoarea noii arhitecturi în ciclul următor, cu migrarea completă așteptată până la mijlocul anului 2026.
Articolul DeepSeek Dezvăluie Seria de Modele V4: Ofensiva AI cu Parametri Ridicați Vizează Eficiența și Performanța de Frontieră a apărut prima dată pe Metaverse Post.


