DeepSeek AI 宣布正式發布其最新一代大型語言模型 DeepSeek-V3.2 及其長思考增強版 DeepSeek-V3.2-Speciale,性能直逼 Gemini、ChatGPT。DeepSeek AI 宣布正式發布其最新一代大型語言模型 DeepSeek-V3.2 及其長思考增強版 DeepSeek-V3.2-Speciale。此次更新的核心亮點在於其推理能力躍升至全球領先水平,在多項基準測試中表現媲美部分頂尖閉源模型,並帶來革命性的 「思考模式下的工具調用」 功能,大幅提升模型在複雜任務中的實用性與泛化能力。 推理能力直逼 GPT-5、Gemini 3.0 Pro DeepSeek 表示,V3.2(標準版)旨在平衡推理能力與輸出效率,適合日常問答及通用 Agent 任務。在公開基準測試中,其推理能力已達到 GPT-5 的水平,僅略微落後於 Gemini 3.0 Pro。 DeepSeek-V3.2-Speciale(增強版)的目標則是將開源模型的推理能力推向極致,結合了 DeepSeek-Math-V2 的定理證明能力,具備極為嚴謹的邏輯與數學驗證能力。而該模型在主流推理基準測試上的表現媲美 Gemini 3.0 Pro。另外,Speciale 版本在多項頂級國際競賽中斬獲佳績,包括 IMO 2025、CMO 2025、ICPC 2025 及 IOI 2025 金牌,其中 ICPC 和 IOI 的成績分別達到人類選手的第二名和第十名水平,充分展現其頂尖的複雜問題解決能力。 思考模式融入工具調用,Agent 能力全面升級 過去的模型常有局限,在進行複雜的「思考推理」時便無法同時使用「外部工具」。DeepSeek-V3.2 首次打破了這一限制,成為 DeepSeek 推出的首個將思考推理與外部工具使用深度融合的模型。 突破性功能:V3.2 版本同時支援思考模式與非思考模式下的工具調用。這意味著模型可以經過「思考 $\rightarrow$ 調用工具 $\rightarrow$ 再次思考 $\rightarrow$ 給出答案」的多步驟流程,處理遠超以往的複雜指令。 Agent 性能飆升:透過大規模 Agent 訓練數據合成方法,模型泛化能力大幅提高。在智能體評測中,DeepSeek-V3.2 已達到當前開源模型的最高水平,顯著縮小了與頂尖閉源模型(如 ChatGPT)在 Agent 任務上的差距。 各平台全面更新,開源資源同步上架 DeepSeek-V3.2 正式版已更新至官方網頁端、App 和 API 服務。Speciale 版本目前以臨時 API 服務形式開放至 2025 年 12 月 15 日,供社群評測與研究之用。 DeepSeek-V3.2 HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2 ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2 DeepSeek-V3.2-Speciale HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Special   延伸閱讀:DeepSeek 攻略:實測在數學、決策、寫報告等應用表現,和 Gemini 與 ChatGPT 相比誰勝出 延伸閱讀:中國 AI 開源最新榜單出爐:DeepSeek 拿下 AI 程式冠軍,阿里、字節猛攻多模態 延伸閱讀:ChatGPT、Gemini、DeepSeek、Claude 哪個強?外媒從 5 面向進行評測 延伸閱讀:海水退潮了?DeepSeek流量雪崩近30%:為何走「俗擱大碗」CP值路線,卻留不住用戶? 加入T客邦Facebook粉絲團DeepSeek AI 宣布正式發布其最新一代大型語言模型 DeepSeek-V3.2 及其長思考增強版 DeepSeek-V3.2-Speciale,性能直逼 Gemini、ChatGPT。DeepSeek AI 宣布正式發布其最新一代大型語言模型 DeepSeek-V3.2 及其長思考增強版 DeepSeek-V3.2-Speciale。此次更新的核心亮點在於其推理能力躍升至全球領先水平,在多項基準測試中表現媲美部分頂尖閉源模型,並帶來革命性的 「思考模式下的工具調用」 功能,大幅提升模型在複雜任務中的實用性與泛化能力。 推理能力直逼 GPT-5、Gemini 3.0 Pro DeepSeek 表示,V3.2(標準版)旨在平衡推理能力與輸出效率,適合日常問答及通用 Agent 任務。在公開基準測試中,其推理能力已達到 GPT-5 的水平,僅略微落後於 Gemini 3.0 Pro。 DeepSeek-V3.2-Speciale(增強版)的目標則是將開源模型的推理能力推向極致,結合了 DeepSeek-Math-V2 的定理證明能力,具備極為嚴謹的邏輯與數學驗證能力。而該模型在主流推理基準測試上的表現媲美 Gemini 3.0 Pro。另外,Speciale 版本在多項頂級國際競賽中斬獲佳績,包括 IMO 2025、CMO 2025、ICPC 2025 及 IOI 2025 金牌,其中 ICPC 和 IOI 的成績分別達到人類選手的第二名和第十名水平,充分展現其頂尖的複雜問題解決能力。 思考模式融入工具調用,Agent 能力全面升級 過去的模型常有局限,在進行複雜的「思考推理」時便無法同時使用「外部工具」。DeepSeek-V3.2 首次打破了這一限制,成為 DeepSeek 推出的首個將思考推理與外部工具使用深度融合的模型。 突破性功能:V3.2 版本同時支援思考模式與非思考模式下的工具調用。這意味著模型可以經過「思考 $\rightarrow$ 調用工具 $\rightarrow$ 再次思考 $\rightarrow$ 給出答案」的多步驟流程,處理遠超以往的複雜指令。 Agent 性能飆升:透過大規模 Agent 訓練數據合成方法,模型泛化能力大幅提高。在智能體評測中,DeepSeek-V3.2 已達到當前開源模型的最高水平,顯著縮小了與頂尖閉源模型(如 ChatGPT)在 Agent 任務上的差距。 各平台全面更新,開源資源同步上架 DeepSeek-V3.2 正式版已更新至官方網頁端、App 和 API 服務。Speciale 版本目前以臨時 API 服務形式開放至 2025 年 12 月 15 日,供社群評測與研究之用。 DeepSeek-V3.2 HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2 ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2 DeepSeek-V3.2-Speciale HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Special   延伸閱讀:DeepSeek 攻略:實測在數學、決策、寫報告等應用表現,和 Gemini 與 ChatGPT 相比誰勝出 延伸閱讀:中國 AI 開源最新榜單出爐:DeepSeek 拿下 AI 程式冠軍,阿里、字節猛攻多模態 延伸閱讀:ChatGPT、Gemini、DeepSeek、Claude 哪個強?外媒從 5 面向進行評測 延伸閱讀:海水退潮了?DeepSeek流量雪崩近30%:為何走「俗擱大碗」CP值路線,卻留不住用戶? 加入T客邦Facebook粉絲團

DeepSeek 推出 V3.2 正式版:性能直逼 Gemini、ChatGPT,並同步開源可使用

2025/12/04 16:00

DeepSeek AI 宣布正式發布其最新一代大型語言模型 DeepSeek-V3.2 及其長思考增強版 DeepSeek-V3.2-Speciale。此次更新的核心亮點在於其推理能力躍升至全球領先水平,在多項基準測試中表現媲美部分頂尖閉源模型,並帶來革命性的 「思考模式下的工具調用」 功能,大幅提升模型在複雜任務中的實用性與泛化能力。

推理能力直逼 GPT-5、Gemini 3.0 Pro

DeepSeek 表示,V3.2(標準版)旨在平衡推理能力與輸出效率,適合日常問答及通用 Agent 任務。在公開基準測試中,其推理能力已達到 GPT-5 的水平,僅略微落後於 Gemini 3.0 Pro。

DeepSeek-V3.2-Speciale(增強版)的目標則是將開源模型的推理能力推向極致,結合了 DeepSeek-Math-V2 的定理證明能力,具備極為嚴謹的邏輯與數學驗證能力。而該模型在主流推理基準測試上的表現媲美 Gemini 3.0 Pro。另外,Speciale 版本在多項頂級國際競賽中斬獲佳績,包括 IMO 2025、CMO 2025、ICPC 2025 及 IOI 2025 金牌,其中 ICPC 和 IOI 的成績分別達到人類選手的第二名和第十名水平,充分展現其頂尖的複雜問題解決能力。

思考模式融入工具調用,Agent 能力全面升級

過去的模型常有局限,在進行複雜的「思考推理」時便無法同時使用「外部工具」。DeepSeek-V3.2 首次打破了這一限制,成為 DeepSeek 推出的首個將思考推理與外部工具使用深度融合的模型。

  • 突破性功能:V3.2 版本同時支援思考模式與非思考模式下的工具調用。這意味著模型可以經過「思考 $\rightarrow$ 調用工具 $\rightarrow$ 再次思考 $\rightarrow$ 給出答案」的多步驟流程,處理遠超以往的複雜指令。
  • Agent 性能飆升:透過大規模 Agent 訓練數據合成方法,模型泛化能力大幅提高。在智能體評測中,DeepSeek-V3.2 已達到當前開源模型的最高水平,顯著縮小了與頂尖閉源模型(如 ChatGPT)在 Agent 任務上的差距。

各平台全面更新,開源資源同步上架

DeepSeek-V3.2 正式版已更新至官方網頁端、App 和 API 服務。Speciale 版本目前以臨時 API 服務形式開放至 2025 年 12 月 15 日,供社群評測與研究之用。

  • DeepSeek-V3.2
    • HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2
    • ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2
  • DeepSeek-V3.2-Speciale
    • HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale
    • ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Special
  • 延伸閱讀:DeepSeek 攻略:實測在數學、決策、寫報告等應用表現,和 Gemini 與 ChatGPT 相比誰勝出
  • 延伸閱讀:中國 AI 開源最新榜單出爐:DeepSeek 拿下 AI 程式冠軍,阿里、字節猛攻多模態
  • 延伸閱讀:ChatGPT、Gemini、DeepSeek、Claude 哪個強?外媒從 5 面向進行評測
  • 延伸閱讀:海水退潮了?DeepSeek流量雪崩近30%:為何走「俗擱大碗」CP值路線,卻留不住用戶?
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 service@support.mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。

您可能也會喜歡