DeepSeek V4 podobno przewyższa ChatGPT i Claude w kodowaniu długiego kontekstu

Plotki głoszą, że DeepSeek V4 przewyższa ChatGPT i Claude w kodowaniu długiego kontekstu, celując w zadania kodowania na poziomie elitarnym. Wtajemniczeni twierdzą, że krajobraz AI w Dolinie Krzemowej powinien być zaniepokojony, jeśli wewnętrzne testy wskazują na oczekiwaną wydajność po wdrożeniu w połowie lutego.

Chiński start-up AI DeepSeek planuje podobno wydać DeepSeek V4, swój najnowszy duży model językowy, 17 lutego. Osoby zaznajomione ze sprawą twierdzą, że model ma rzucić cień na istniejące duże modele językowe, takie jak ChatGPT OpenAI i Claude Anthropic, podczas obsługi podpowiedzi i zadań kodu długiego kontekstu.

Deweloperzy wyrażają głębokie oczekiwanie na wydanie DeepSeek V4

Chińska firma nie ujawniła publicznie żadnych informacji o zbliżającym się wydaniu ani nie potwierdziła plotek w momencie pisania tego tekstu. Deweloperzy w różnych sieciach społecznościowych wyrazili głębokie oczekiwanie na wydanie. Yuchen Jin, deweloper AI i współzałożyciel Hyperbolic Labs, napisał na X, że "plotki głoszą, że DeepSeek V4 pojawi się wkrótce, z silniejszym kodowaniem niż Claude i GPT."

Subreddit r/DeepSeek również rozgrzał się, a jeden użytkownik wyjaśnił, że jego obsesja na punkcie zbliżającego się modelu V4 DeepSeek nie była normalna. Użytkownik powiedział, że często "sprawdza wiadomości, możliwe plotki, a nawet czyta dokumentację na stronie DS, aby szukać jakichkolwiek zmian lub oznak wskazujących na aktualizację."

Poprzednie wydania DeepSeek miały znaczący wpływ na światowe rynki. Chiński start-up AI wydał swój model rozumowania R1 w styczniu 2025 roku, prowadząc do wyprzedaży wartej bilion dolarów. Wydanie dorównało modelowi 01 OpenAI w testach matematycznych i rozumowania, mimo że kosztowało znacznie mniej niż amerykański start-up AI wydał na swój model 01.

Chińska firma podobno wydała tylko 6 milionów dolarów na wydanie modelu. Tymczasem globalni konkurenci wydają prawie 70 razy więcej na ten sam rezultat. Jej model V3 również osiągnął wynik 90,2% w teście MATH-500, w porównaniu do 78,3% Claude. Nowsza aktualizacja V3 DeepSeek (V3.2 Speciale) dodatkowo poprawiła jego produktywność.

Punkt sprzedaży modelu V4 ewoluował z nacisku V3 na czyste rozumowanie, formalne dowody i matematykę logiczną. Oczekuje się, że nowe wydanie będzie modelem hybrydowym, który łączy zadania rozumowania i nie-rozumowania. Model ma na celu zdobycie rynku deweloperów poprzez wypełnienie istniejącej luki wymagającej wysokiej dokładności i generowania kodu długiego kontekstu.

Claude Opus 4.5 obecnie dominuje w teście SWE, osiągając dokładność 80,9%. V4 musi to pokonać, aby obalić Claude Opus 4.5. Na podstawie poprzednich sukcesów, nadchodzący model może przekroczyć ten próg i zdobyć dominację w teście.

DeepSeek pionierem mHC do trenowania LLM

Sukces DeepSeek pozostawił wielu w głębokim profesjonalnym niedowierzaniu. Jak taka mała firma mogła osiągnąć takie kamienie milowe? Sekret może być głęboko zakorzeniony w jej artykule naukowym opublikowanym 1 stycznia. Firma zidentyfikowała nową metodę trenowania, która pozwala deweloperom łatwo skalować duże modele językowe. Liang Wenfeng, założyciel i CEO DeepSeek, napisał w badaniach, że firma używa Manifold-Constrained Hyper-Connections (mHC) do trenowania swoich modeli AI.

Dyrektor zaproponował użycie mHC do rozwiązania problemów napotkanych przez deweloperów podczas trenowania dużych modeli językowych. Według Wenfenga, mHC jest ulepszeniem Hyper-Connections (HC), frameworka używanego przez innych deweloperów AI do trenowania ich dużych modeli językowych. Wyjaśnił, że HC i inne tradycyjne architektury AI wymuszają przepływ wszystkich danych przez pojedynczy, wąski kanał. Jednocześnie mHC poszerza tę ścieżkę na wiele kanałów, ułatwiając transfer danych i informacji bez powodowania załamania treningu.

Lian Jye Su, główny analityk w Omdia, pochwalił CEO Wenfenga za opublikowanie ich badań. Su podkreślił, że decyzja DeepSeek o opublikowaniu metod trenowania dyktuje odnowione zaufanie w chińskim sektorze AI. DeepSeek zdominował rozwijający się świat. Microsoft opublikował raport w czwartek, pokazując, że DeepSeek kontroluje 89% chińskiego rynku AI i zyskuje impet w krajach rozwijających się.

Chcesz, aby Twój projekt trafił przed najlepsze umysły w krypto? Przedstaw go w naszym następnym raporcie branżowym, gdzie dane spotykają się z wpływem.

Źródło: https://www.cryptopolitan.com/deepseek-v4-chatgpt-and-claude/