Google Gemini 3系列模型推出後就獲得不少好評,繼推出系列中的Gemini 3 Pro與Gemini 3 Deep Think兩款較為專業的模型後,Google再宣布推出輕量級的Gemini 3 Flash,強調大幅降低運算成本但保有Gemini 3系列複雜推論、多模態、視覺理解、代理與Vibe編碼的突破性性能,具備低延遲、效率與成本效益。
Gemini 3 Flash即日起全面推出,並取代Gemini 2.5 Flash作為Gemini應用程式的預設模型,也同時成為Google搜尋服務AI模式中的預設模型。對於開發者,Gemini 3 Flash也已經透過Google AI Studio、Google Antigravity、Vertex AI和Gemini Enterprise中的Gemini API提供預覽版,或透過Gemini CLI和Android Studio等開發工具使用。
▲Gemini 3 Flash在許多基準測試甚至超越前一代Pro模型
Gemini 3 Flash雖是輕量模型,但在許多基準測試展現以小搏大的出色表現,在許多基準測試超越Gemini 2.5與Gemini 2.5 Pro,甚至在MMMU Pro測試幾乎與Gemini 3 Pro並駕齊驅。
就如同過往的Flash模型,Gemini 3 Flash在保有Gemini 3系列出色的推論與多模態處理能力的前提,保有高效率、高品質、低成本及迅捷的優點,於最高思維層次執行任務,可靈活調整思考時間,雖然在複雜應用場景會需要較長的思考時間,不過在典型流量測試,平均使用Token數量能夠比Gemini 2.5 Pro少30%,進而更快完成日常任務。
▲Gemini 3 Flash雖在複雜任務需要較長的思考時間,但在一般日常任務的表現相當出色
Google強調Gemini 3 Flash能夠大幅降低成本,但在日常任務負載超越Gemini 2.5 Pro;Gemini 3 Flash於Artifical Analysis基準測試有著比Gemini 2.5 Pro快三倍的表現,但每百萬個輸入Token僅需0.5美金、每百萬個輸出Token僅3美金(不過音訊輸入維持每百萬個Token 1美金。)。
Gemini 3 Flash在編碼的表現也極為出色,且延遲相當低,能夠在頻繁的工作流程快速進行推論與解決任務,甚至在評估編碼代理的SWE-bench Verified基準測試不僅超越所有的Gemini 2.5系列,還優於Gemini 3 Pro,顯示Gemini 3 Flash於代理編碼、生產就緒系統與互動應用程式有著出色的平衡。
也由於Gemini 3 Flash在推論、工具使用與多模態的出色表現,適合希望進行更複雜的視覺分析、數據提取與視覺問答的開發者,並可實現像是遊戲助手或A/B測試實驗等需要在短時間以深度推論提供答案的應用。


