Anthropic 正式發布旗艦模型 Opus 4.6,支援 1 百萬 token 上下文、Agent Tea […] 〈Claude Opus 4.6 來了:自己寫編譯器、做 PPT、隨手挖出 500 個零日漏洞,你的工作它都想試試〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。Anthropic 正式發布旗艦模型 Opus 4.6,支援 1 百萬 token 上下文、Agent Tea […] 〈Claude Opus 4.6 來了:自己寫編譯器、做 PPT、隨手挖出 500 個零日漏洞,你的工作它都想試試〉這篇文章最早發佈於動區BlockTempo《動區動趨-最具影響力的區塊鏈新聞媒體》。

Claude Opus 4.6 來了:自己寫編譯器、做 PPT、隨手挖出 500 個零日漏洞,你的工作它都想試試

2026/02/06 11:49
閱讀時長 8 分鐘
如需對本內容提供反饋或相關疑問,請通過郵箱 crypto.news@mexc.com 聯絡我們。
Anthropic 正式發布旗艦模型 Opus 4.6,支援 1 百萬 token 上下文、Agent Teams 多代理協作,並在測試中自主發現 500 個零日漏洞,加速 AI 從輔助工具轉型為獨立數位員工。 (前情提要:Clawdbot 封神,一個讓 Mac mini 賣斷貨的 7×24 小時 AI 管家) (背景補充:小心!Clawdbot 配置不當恐藏重大安全漏洞:有用戶加密錢包遭洗劫一空)   Anthropic 今(6)天正式發布 Claude Opus 4.6,距離上一代 Opus 4.5 推出僅三個月。現已在 claude.ai、Anthropic API、Amazon Bedrock、Google Cloud Vertex AI 等平台全面上線。 定價維持不變:每百萬 token 輸入 5 美元、輸出 25 美元。價格不變的背後,我們來看看新模型有哪些改善? Introducing Claude Opus 4.6. Our smartest model got an upgrade. Opus 4.6 plans more carefully, sustains agentic tasks for longer, operates reliably in massive codebases, and catches its own mistakes. It’s also our first Opus-class model with 1M token context in beta. pic.twitter.com/L1iQyRgT9x — Claude (@claudeai) February 5, 2026   核心三大升級 1M token 上下文窗口(Beta) Opus 4.6 首次在旗艦級模型中支援 100 萬 token 的上下文窗口,這是 Opus 4.5 的五倍(200k → 1M)。實際意義是什麼?大約等於 1,500 頁文字、30,000 行程式碼、或超過一小時的影片內容。 這讓 Claude 可以在單一對話中處理整個程式碼庫、完整的法律文件、或一整季的財報,不再需要切割、摘要、分批處理。 在長上下文檢索能力測試 MRCR v2 的百萬 token 變體中,Opus 4.6 達到 76% 準確率,而前代 Sonnet 4.5 僅有 18.5%,達到質的飛躍。 自適應思考 過去的模型是二選一:快速回應或是深度推理。Opus 4.6 引入了「自適應思考」機制,模型會根據任務複雜性自動決定何時需要深入思考、何時可以快速回應。 開發者可以透過新的 effort 參數,在低、中、高、最大四個級別之間調整智能、速度與成本的平衡。簡單查詢用低檔省錢,複雜推理開最大檔全力運算。 128k 輸出 token 單次回應可以輸出最多 128,000 個 token,這讓模型可以一次生成完整的程式模組、長篇報告、或複雜的分析文件,而不需要人工拼接多次輸出。 Agent Teams:多個 Claude 協同作戰 這次更新最具顛覆性的功能是 Agent Teams:讓多個 Claude 代理人並行運作、各自負責子任務、彼此協調進度。 傳統的 AI 工作流程是單一代理人從頭做到尾。問題在於,當任務變得複雜,單一代理人容易卡住、遺忘上下文、或陷入錯誤循環。 Agent Teams 的解法是分工。一個代理人負責前端、一個負責後端、一個負責測試。每個代理人專注於自己的領域,透過共享的任務目錄同步進度。當一個代理人完成工作,它會拉取其他代理人的更新、合併修改、推送自己的進度、釋放鎖定——讓整個系統持續並行運作。 Anthropic 研究員 Nicholas Carlini 用這套系統做了一個瘋狂的實驗:讓多個 Claude 並行開發一個 C 編譯器。 結果是一個 10 萬行的 Rust 程式碼庫,能夠成功編譯 Linux 6.9 核心,支援 x86、ARM、RISC-V 三種架構。這個編譯器通過了 99% 的標準測試,成功編譯了 QEMU、FFmpeg、SQLite、Postgres。 代價?大約 2,000 次 Claude Code session,API 費用接近 2 萬美元。但這證明了一件事:自主化大規模開發不再是科幻,而是工程現實。 500 個零日漏洞,AI 成漏洞獵人 在發布前,Anthropic 團隊對 Opus 4.6 進行了一項非傳統測試:把模型放進沙盒環境,給它 Python、除錯器、模糊測試工具,但不給任何特定指令或專業知識。 結果?Claude 自主發現了超過 500 個此前未知的安全漏洞,涵蓋多個主流開源專案。這些漏洞包括可導致系統崩潰的缺陷、記憶體損壞問題、以及緩衝區溢位。具體案例包括: GhostScript:發現可導致程式崩潰的漏洞 OpenSC:發現緩衝區溢位漏洞 CGIF:發現緩衝區溢位,並主動撰寫了概念驗證程式碼來證明漏洞真實存在 每個漏洞都經過 Anthropic 團隊成員或外部安全研究員的驗證。Anthropic 也因此為 Opus 4.6 增加了新的安全控制措施,包括即時偵測系統,用於識別和阻擋可能的惡意濫用。 基準測試:全面超越前代與競爭對手 根據獨立評測 GDPval-AA,Opus 4.6 的表現: 比 OpenAI GPT-5.2 高出約 144 Elo 分 比前代 Opus 4.5 高出 190 Elo 分 在代理式編碼測試 Terminal-Bench 2.0 中,Opus 4.6 取得最高分。 Anthropic 官方描述這個模型「計畫更周密、能持續進行更長的代理任務、在大型程式碼庫中運作更可靠、程式碼審查與除錯能力更強」。 產品整合到 Office 套件 Claude in Excel(增強版) Excel 整合大幅升級,現在支援長期運行任務和多步驟變更。你可以讓 Claude 處理整個試算表的重構,而不只是回答單...
市場機遇
4 圖標
4實時價格 (4)
$0.016992
$0.016992$0.016992
-0.61%
USD
4 (4) 實時價格圖表
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 crypto.news@mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

$30,000 等值 PRL + 15,000 USDT

$30,000 等值 PRL + 15,000 USDT$30,000 等值 PRL + 15,000 USDT

充值並交易 PRL,即可提升您的獎勵!