Pe scurt
- Anthropic pregătește Claude Opus 4.7 și un instrument AI de design pentru site-uri web și prezentări
- Claude Mythos rămâne adevăratul model de frontieră al Anthropic, iar compania nu îl va lansa public.
- Industria încă nu poate măsura în mod fiabil îmbunătățirile AI, făcând dificilă verificarea afirmațiilor despre progresele Opus 4.7.
Anthropic se pregătește să lanseze Claude Opus 4.7 alături de un nou instrument de design alimentat de AI care permite utilizatorilor să construiască site-uri web, prezentări și pagini de destinație cu comenzi în limbaj natural—veste care a cauzat o scădere a acțiunilor Adobe, Wix și Figma luni, conform The Information.
Produsele ar putea fi lansate chiar în această săptămână, a declarat o persoană cu cunoștință de planuri pentru The Information. Instrumentul de design vizează atât dezvoltatorii, cât și utilizatorii non-tehnici, punându-l pe un curs de coliziune cu startup-uri precum Gamma și Stitch de la Google.
Anthropic nu a răspuns la solicitarea de comentarii a Decrypt.
Opus 4.7 nu este nici măcar cel mai puternic model al Anthropic. Acest titlu îi aparține Claude Mythos—o bestie axată pe securitate cibernetică pe care compania o furnizează în tăcere unor firme selectate de securitate, menținând-o departe de public.
Institutul de Securitate AI din Regatul Unit a evaluat recent Mythos Preview și a constatat că poate executa autonom atacuri cibernetice sofisticate cu rate pe care niciun alt model nu le-a egalat. A devenit primul AI care a finalizat "The Last Ones", o simulare de atac asupra rețelei corporative în 32 de pași care de obicei necesită 20 de ore pentru echipele umane red team. Mythos a reușit în trei din zece încercări, cu o medie de 22 din 32 de pași—comparativ cu 16 ale Opus 4.6.
Acest lucru contează dincolo de securitatea corporativă. Măsurarea a ceea ce poate face efectiv AI a devenit o durere de cap la nivelul întregii industrii. OpenAI a declarat recent că principalul benchmark de codare este "contaminat", totuși modelele continuă să fie comparate folosind aceleași teste. O evaluare separată ARC-AGI-3 a înregistrat pentru Gemini un scor de 0,37%, iar GPT-5.4 a atins 0,26%—în timp ce oamenii au obținut 100%. Rezultatul este un peisaj în care benchmark-urile sunt atât contestate, cât și încă folosite ca dovadă, făcând dificilă contextualizarea afirmațiilor despre progresele Opus 4.7 până când Anthropic publică o fișă detaliată a modelului.
Relația dintre Opus și Mythos este mai strânsă decât își dau seama majoritatea. Anthropic își construiește modelele de frontieră prin ajustare fină deasupra liniei Opus—aceeași structură de bază care alimentează produsele Claude publice este testată intens și consolidată în Mythos. Opus 4.7 este fundația care primește în cele din urmă kung fu-ul de securitate cibernetică.
De asemenea, eforturile Anthropic au fost orientate mai mult către cazul de utilizare pentru dezvoltare/întreprinderi. Scurgerea codului Claude, lansarea sistemului de abilități și a protocolului MCP, concentrarea pe AI agentic și atenția acordată benchmark-urilor de codare fac acest lucru și mai evident. Deși Anthropic nu a anunțat oficial, scurgerile consolidează trecerea mai amplă de la furnizor LLM la ceva care seamănă cu un model de "studio AI" full-stack, unde Claude nu doar generează text, ci construiește și implementează produse complete.
Newsletter Daily Debrief
Începe fiecare zi cu cele mai importante știri ale momentului, plus articole originale, un podcast, videoclipuri și multe altele.
Sursă: https://decrypt.co/364483/anthropic-opus-47-full-stack-ai-studio-mythos








