Anthropic pregătește Opus 4.7 și Studio AI Full-Stack—În timp ce stă pe ceva mult mai înfricoșător

Pe scurt

Anthropic pregătește Claude Opus 4.7 și un instrument AI de design pentru site-uri web și prezentări
Claude Mythos rămâne adevăratul model de frontieră al Anthropic, iar compania nu îl va lansa public.
Industria încă nu poate măsura în mod fiabil îmbunătățirile AI, făcând dificilă verificarea afirmațiilor despre progresele Opus 4.7.

Anthropic se pregătește să lanseze Claude Opus 4.7 alături de un nou instrument de design alimentat de AI care permite utilizatorilor să construiască site-uri web, prezentări și pagini de destinație cu comenzi în limbaj natural—veste care a cauzat o scădere a acțiunilor Adobe, Wix și Figma luni, conform The Information.

Produsele ar putea fi lansate chiar în această săptămână, a declarat o persoană cu cunoștință de planuri pentru The Information. Instrumentul de design vizează atât dezvoltatorii, cât și utilizatorii non-tehnici, punându-l pe un curs de coliziune cu startup-uri precum Gamma și Stitch de la Google.

Anthropic nu a răspuns la solicitarea de comentarii a Decrypt.

Opus 4.7 nu este nici măcar cel mai puternic model al Anthropic. Acest titlu îi aparține Claude Mythos—o bestie axată pe securitate cibernetică pe care compania o furnizează în tăcere unor firme selectate de securitate, menținând-o departe de public.

Institutul de Securitate AI din Regatul Unit a evaluat recent Mythos Preview și a constatat că poate executa autonom atacuri cibernetice sofisticate cu rate pe care niciun alt model nu le-a egalat. A devenit primul AI care a finalizat "The Last Ones", o simulare de atac asupra rețelei corporative în 32 de pași care de obicei necesită 20 de ore pentru echipele umane red team. Mythos a reușit în trei din zece încercări, cu o medie de 22 din 32 de pași—comparativ cu 16 ale Opus 4.6.

Acest lucru contează dincolo de securitatea corporativă. Măsurarea a ceea ce poate face efectiv AI a devenit o durere de cap la nivelul întregii industrii. OpenAI a declarat recent că principalul benchmark de codare este "contaminat", totuși modelele continuă să fie comparate folosind aceleași teste. O evaluare separată ARC-AGI-3 a înregistrat pentru Gemini un scor de 0,37%, iar GPT-5.4 a atins 0,26%—în timp ce oamenii au obținut 100%. Rezultatul este un peisaj în care benchmark-urile sunt atât contestate, cât și încă folosite ca dovadă, făcând dificilă contextualizarea afirmațiilor despre progresele Opus 4.7 până când Anthropic publică o fișă detaliată a modelului.

Relația dintre Opus și Mythos este mai strânsă decât își dau seama majoritatea. Anthropic își construiește modelele de frontieră prin ajustare fină deasupra liniei Opus—aceeași structură de bază care alimentează produsele Claude publice este testată intens și consolidată în Mythos. Opus 4.7 este fundația care primește în cele din urmă kung fu-ul de securitate cibernetică.

De asemenea, eforturile Anthropic au fost orientate mai mult către cazul de utilizare pentru dezvoltare/întreprinderi. Scurgerea codului Claude, lansarea sistemului de abilități și a protocolului MCP, concentrarea pe AI agentic și atenția acordată benchmark-urilor de codare fac acest lucru și mai evident. Deși Anthropic nu a anunțat oficial, scurgerile consolidează trecerea mai amplă de la furnizor LLM la ceva care seamănă cu un model de "studio AI" full-stack, unde Claude nu doar generează text, ci construiește și implementează produse complete.

Newsletter Daily Debrief

Începe fiecare zi cu cele mai importante știri ale momentului, plus articole originale, un podcast, videoclipuri și multe altele.

Sursă: https://decrypt.co/364483/anthropic-opus-47-full-stack-ai-studio-mythos

Anthropic pregătește Opus 4.7 și Studio AI Full-Stack—În timp ce stă pe ceva mult mai înfricoșător

Pe scurt

Newsletter Daily Debrief

Poate îți place și

Bitcoin Depot Inițiază un Proces Voluntar de Reorganizare conform Capitolului 11 pentru a Facilita o Lichidare Ordonată și Vânzarea Activelor Companiei

Bărbatul cunoscut drept Regele Wall Street anunță previziunile FED privind rata dobânzii și inflația pentru 2026!

Proof of Talk revine la Luvru cu peste 100 de vorbitori de nivel C reprezentând 18 trilioane de dolari în AUM

Știri în tendințe

TIMVERO Lansează timveroAI: Un Prim Strat AI din Industrie pe timveroOS

Tesla (TSLA) Stock: Vânzările de vehicule electrice din China cresc pentru al doilea trimestru consecutiv

De Ce Explodează Tranzacționarea SpaceX PreStocks Pe Solana?

Disponibilizările de la Kraken și schimbarea spre AI ar putea întârzia IPO-ul până în 2027

Știri Crypto Astăzi: Ar Putea Aceasta Semnala Cea Mai Mare Oportunitate de Prevânzare a Pepeto Înainte de Binance

Știri în timp real 24/7

Prețuri cripto