企業在導入 AI 應用時,往往面臨「不可能三角」的困境:高效能模型價格昂貴、平價模型能力不足、整合外部工具需要大量工程資源。這個現實讓許多中小企業只能望 AI 興嘆,或是被迫在成本與品質之間妥協。然而,AWS 在 re:Invent 2025 大會上發布的 Amazon Nova 2 模型家族,正試圖打破這個困局。
Amazon Nova 2 並非單一模型,而是四款針對不同應用場景優化的模型家族:Nova 2 Lite 以產業領先的價格效能比處理日常工作負載、Nova 2 Pro 以最高智慧水準解決複雜任務、Nova 2 Sonic 提供即時語音對話能力、Nova 2 Omni 則是業界首創能同時處理並生成多模態內容的統一模型。更關鍵的是,Nova 2 Lite 和 Pro 內建網頁搜尋與程式碼執行能力,讓開發者無需串接外部 API 即可獲得完整功能。
這套模型家族的發布,代表 AWS 正在實踐「AI 民主化」的承諾:讓任何規模的企業都能以合理成本取得高效能 AI 能力,不再需要龐大的技術團隊或預算才能啟動 AI 轉型。
Amazon Nova 2 Lite 的定位明確:為企業日常 AI 任務提供最佳價格效能比的推理模型。在效能測試中,Nova 2 Lite 在 15 項基準測試中有 13 項等於或優於 Claude Haiku 4.5、17 項測試中有 11 項等於或優於 GPT-5 Mini、18 項測試中有 14 項等於或優於 Gemini Flash 2.5。這些數據證明 Nova 2 Lite 並非「便宜但堪用」的妥協選擇,而是真正具備競爭力的高效能模型。
Nova 2 Lite 支援延伸思考 (Extended Thinking) 功能,讓開發者能調整模型在回應前進行「逐步推理」的深度。這項功能預設為關閉狀態以提供快速、低成本的回應,但當任務需要更深入分析時,可啟用並選擇低、中、高三種思考預算等級,在速度、智慧與成本之間取得平衡。這種彈性讓同一個模型既能處理簡單的客服查詢,也能執行需要邏輯推理的複雜任務。
該模型能處理文字、圖像、影片、文件作為輸入,並提供一百萬個 token 的上下文視窗,這讓企業能在單一對話中處理大量資訊。典型應用場景包括客戶服務聊天機器人、文件處理、業務流程自動化,以及需要從影片中提取資訊的任務。Nova 2 Lite 在文件處理、影片資訊提取、程式碼生成、提供準確的資訊驗證回答,以及自動化多步驟代理式工作流程方面展現出色能力。
當企業面臨需要最高準確度的複雜任務時,Amazon Nova 2 Pro 是 Amazon 最智慧的推理模型。在效能測試中,Nova 2 Pro 在 16 項基準測試中有 10 項等於或優於 Claude Sonnet 4.5、16 項測試中有 8 項等於或優於 GPT-5.1、19 項測試中有 15 項等於或優於 Gemini 2.5 Pro、18 項測試中有 8 項等於或優於 Gemini 3 Pro Preview。
Nova 2 Pro 能處理文字、圖像、影片、語音輸入並生成文字輸出,特別適合高度複雜的任務,如代理式編碼 (Agentic Coding)、長期規劃、複雜問題解決等需要最高準確度的場景。該模型在多文件分析、影片推理、遵循複雜指令、解決進階數學問題,以及執行代理式與軟體工程任務方面展現優勢。
值得注意的是,Nova 2 Pro 還能作為「教師」模型進行知識蒸餾 (Knowledge Distillation),將其能力轉移到更小、更高效的「學生」模型中,讓企業能針對特定領域和應用場景客製化模型。這種做法讓企業在特定任務上既能保持高品質,又能降低推理成本。
Amazon Nova 2 Sonic 是 Amazon 的語音對話基礎模型,將文字與語音的理解和生成統一在單一模型中,實現真正的即時、類人語音對話。相較於傳統需要串接語音轉文字 (Speech-to-Text, STT)、大型語言模型 (Large Language Model, LLM)、文字轉語音 (Text-to-Speech, TTS) 多個模型的複雜架構,Nova 2 Sonic 的統一設計不僅簡化開發流程,更能保留關鍵的聲學脈絡 (Acoustic Context),讓 AI 能根據使用者的語調、節奏、說話風格來調整回應。
Nova 2 Sonic 提供富有表現力的聲音選項,每種支援語言都有陽性與陰性聲音,具備原生表達能力、自然的輪流對話機制,以及順暢處理使用者打斷的能力。人類偏好評估顯示,聽眾持續偏好 Nova 2 Sonic 的輸出,勝過其他領先模型的整體聆聽體驗。在價格效能與品質方面,Nova 2 Sonic 相較於 OpenAI 的 gpt-realtime 和透過即時 API 提供的 Gemini 2.5 Flash 模型,展現產業領先的優勢。
該模型支援擴展的多語言能力,除了原本的英語、法語、義大利語、德語、西班牙語外,現在新增葡萄牙語和印地語。更重要的是,Nova 2 Sonic 引入多語言聲音 (Polyglot Voices) 功能,單一聲音 (如 Tiffany 聲音) 能在同一對話中流暢地切換所有支援的語言,這讓企業能用單一語音模型服務全球受眾,無需為每種語言部署獨立模型。該模型還支援跨模態互動,讓使用者在同一對話中自由切換語音與文字輸入,同時維持完整的對話脈絡。
Nova 2 Sonic 展現先進的多代理能力,透過非同步工具呼叫 (Asynchronous Tool Calling) 改善語音對話 AI 處理複雜、多步驟任務的方式。當模型需要呼叫外部工具或服務時,它不會暫停對話,而是在工具於背景執行的同時持續回應新的使用者輸入。這種能力支援複雜的互動,能在維持參與度和回應性的同時,管理多個不相關的任務。
Amazon Nova 2 Omni 是業界首創能同時處理文字、圖像、影片、語音輸入,並生成文字與圖像輸出的統一多模態模型。這項突破消除了過去需要串接多個專門模型的成本與複雜性。Nova 2 Omni 能同時處理最多 75 萬字、數小時音訊、長影片和數百頁文件,一次性分析完整的產品目錄、客戶見證、品牌指南和影片庫。
這種統一架構的實際價值在行銷場景中特別明顯。傳統做法需要分別使用圖像理解模型分析產品照片、文字模型處理品牌指南、影片模型分析廣告素材、圖像生成模型製作視覺內容,每個環節都需要工程師撰寫整合程式碼。而 Nova 2 Omni 能在單一工作流程中跨所有格式分析產品細節,立即生成完整的行銷活動,包括標題、文案、社群媒體貼文和視覺內容。
雖然業界目前沒有可與 Nova 2 Omni 直接比較的模型,但它在文件、圖像、影片和音訊的多模態推理公開基準測試中展現優勢,並能生成與其他領先圖像生成模型相似品質的高品質圖像。Cisco、Siemens、Sumo Logic 和 Trellix 等企業正在使用 Nova 2 模型,應用範圍從代理式威脅偵測到影片理解和語音 AI 助理。
Nova 2 Lite 和 Pro 最具差異化的特點,是內建網頁搜尋 (Web Grounding) 與程式碼執行 (Code Execution) 兩項工具。這看似簡單的設計,實則為開發者帶來巨大價值。
傳統的 AI 模型 (包括 Claude、GPT 系列) 若要實現網頁搜尋功能,開發者需要自行整合搜尋引擎 API (如 Google Search API、Bing Search API),處理 API 金鑰管理、費用計算、結果解析、內容擷取等複雜工作。而 Nova 2 的網頁搜尋功能讓模型能直接檢索公開資訊並附上引用來源,確保回應始終基於最新事實而非僅依賴訓練資料。這對需要即時資訊的應用 (如新聞摘要、市場分析、產品比價) 特別重要。
程式碼執行功能同樣解決了痛點。過去若要讓 AI 模型執行程式碼 (例如數據分析、圖表繪製、數學運算),開發者需要建立安全的沙盒環境、處理程式碼注入風險、管理執行逾時等問題。Nova 2 的內建程式碼執行器讓模型能在同一工作流程中撰寫並執行程式碼,立即驗證結果。這讓企業能快速建立數據分析工具、自動化報表系統,而無需額外的基礎設施投資。
這兩項內建工具不僅簡化開發流程,更大幅降低技術門檻。中小企業無需配置專門的 DevOps 團隊來維護外部整合,就能享有完整的 AI 功能。這正是 Nova 2「讓高效能 AI 不再是大企業專利」的核心體現。
對於需要將專有知識深度整合到 AI 應用的企業,Amazon Nova Forge 提供業界首創的「開放訓練」 (Open Training) 方法。Nova Forge 讓企業能建立自己的 Nova 優化變體 (稱為「Novellas」),透過在訓練的各個階段混合專有資料與 Amazon Nova 精選資料集,創造出結合 Nova 完整知識和推理能力,同時深度理解企業特定業務的客製化模型。
企業目前在客製化 AI 模型時面臨三種妥協:僅表面客製化專有模型、持續訓練開放權重模型但可能導致災難性遺忘 (Catastrophic Forgetting)、或是從零開始建構模型但成本高昂。Nova Forge 則提供第四條路徑:取得 Nova 的預訓練、中期訓練、後期訓練檢查點 (Checkpoints) 的獨家存取權,讓企業在訓練的每個階段混合專有資料與 Amazon Nova 精選資料集。
Nova Forge 提供三項額外的強大功能:首先,能使用企業自己的環境進行強化學習訓練,這些環境稱為「強化學習健身房」 (Reinforcement Learning Gyms),是反映真實應用場景的合成環境。其次,能透過合成資料蒸餾 (Synthetic Data-based Distillation) 建立更小、更快但保持智慧的模型,這些模型是用較大模型生成的 AI 範例來訓練。第三,提供負責任 AI 工具套件,讓企業能實施安全控制。
Booking.com、Cosine AI、Nimbus Therapeutics、Nomura Research Institute、OpenBabylon、Reddit 和 Sony 等企業正在使用 Nova Forge 建立自己的模型,以更好地滿足獨特需求。Reddit 的技術長 Chris Slowe 表示:「與 Nova Forge 合作讓我們能用更統一的系統改善 Reddit 的內容審核,已經展現出色成果。我們正在用單一、更準確的解決方案取代多個不同模型,讓審核更有效率。用一個整合方法取代多個專門的機器學習工作流程,標誌著我們在 Reddit 實施和擴展 AI 方式的轉變。」
Amazon Nova Act 現已作為 AWS 服務推出,用於建立和部署能在網頁瀏覽器中執行動作的高可靠度 AI 代理。由客製化的 Nova 2 Lite 模型驅動,Nova Act 提供建立和管理瀏覽器自動化任務代理群的最快且最簡單路徑。Nova Act 在早期客戶工作流程中達到 90% 的可靠度,並在相關基準測試中優於競爭模型。
Nova Act 透過強化學習訓練客製化的 Nova 2 Lite 模型,在數百個模擬網頁環境中執行數千項任務,實現突破性的可靠度。這種訓練方式讓 Nova Act 在基於 UI 的工作流程中表現出色,例如在客戶關係管理 (Customer Relationship Management, CRM) 系統中更新資料、測試網站功能,或提交健康保險理賠。
多個產業的企業已經看到 Nova Act 的成果。新創公司 Sola Systems 整合 Nova Act 為客戶每月自動化數十萬個工作流程,涵蓋對帳、協調出貨、更新醫療記錄等關鍵業務任務。1Password 使用 Nova Act 讓使用者以更少的手動步驟存取登入資訊,並用單一簡單提示就能在數百個不同網站上自動運作。Hertz 使用 Nova Act 將軟體交付速度提升 5 倍,並消除品質保證 (Quality Assurance, QA) 瓶頸,在處理數百萬日常預訂的租車平台上自動化端到端測試,將過去需要數週的工作轉變為數小時。
回顧 Nova 2 模型家族的完整設計,我們能清楚看到 AWS 在「AI 民主化」上的策略思維。這不僅僅是推出效能優異的模型,而是系統性地拆除企業導入 AI 的每一道障礙。
技術門檻的拆除:內建網頁搜尋與程式碼執行工具,讓開發者無需處理複雜的外部整合。Nova 2 Sonic 的統一語音架構,消除了傳統語音 AI 需要串接多個模型的複雜性。Nova 2 Omni 的多模態統一設計,讓企業不再需要維護多個專門模型。
成本門檻的拆除:四款模型針對不同場景優化,企業能根據任務需求選擇最具成本效益的方案。Nova 2 Lite 在日常任務中提供產業領先的價格效能比,而 Nova 2 Pro 只在需要最高準確度時才使用。這種彈性讓企業能大幅降低 AI 營運成本。
客製化門檻的拆除:Nova Forge 讓企業無需龐大預算就能擁有深度整合專有知識的前沿模型。透過開放訓練方法,中型企業也能建立專屬的 AI 能力,不再受制於通用模型的限制。
應用門檻的拆除:Nova Act 讓瀏覽器 UI 自動化從複雜的技術挑戰變成簡單的自然語言指令。90% 的可靠度意味著企業能真正將 AI 代理應用在生產環境,而非僅停留在概念驗證階段。
當 AI 的高牆逐一被拆除,企業能真正專注在「用 AI 創造價值」而非「克服技術障礙」。這正是 Nova 2 模型家族最深遠的意義:讓任何規模的企業都能平等地站在 AI 轉型的起跑線上。
想了解 Amazon Nova 2 模型家族如何協助您的企業實現 AI 轉型?立即聯絡 AWS 台灣團隊,我們的專家將為您規劃最適合的解決方案。
參考資料
• Amazon Nova 產品頁面
• Amazon Bedrock
• Amazon Nova 2 Lite 技術部落格
• Amazon Nova 2 Sonic 技術部落格
• Amazon Nova Forge 技術部落格
• AWS re:Invent 2025 新聞
無法去拉斯維加斯親自體驗?歡迎報名參與Best of AWS re:Invent (AWS 雲端科技發表會) 線上參與,一樣精彩!
本文章內容由「Amazon Web Services (AWS)」提供。


