美股

Google發布Gemini 3.5 Flash！成本砍半、速度快4倍

鉅亨網新聞中心2026-05-20 16:40

在今日舉行的 Google(GOOGL-US) I/O 2026 開發者大會上，公司執行長皮查伊（Sundar Pichai）正式發表新一代大型語言模型系列 Gemini 3.5，首發推出 Gemini 3.5 Flash，並定位為「至今為止最強大的代理與程式設計模型」。

根據《CNBC》報導，皮查伊（Sundar Pichai）形容 Gemini 3.5 Flash「速度驚人」，其價格僅為同級頂尖模型的二分之一，甚至低至三分之一。

‌

Google 表示，3.5 Flash 即日起將成為全球 Gemini 應用程式及搜尋 AI 模式的預設模型，讓使用者「不必再為了速度而犧牲品質」。

此外，該模型的資安防護也同步強化，降低產生有害內容或誤拒合理提問的機率。不過，較重量級的 Gemini 3.5 Pro 目前仍在內部使用，預計下個月才會對外開放。

數據上，在 GDPval-AA 測試中，Gemini 3.5 Flash 拿下 1656 Elo 分數。這項基準主要評估模型處理「具真實商業價值的程式開發任務」能力，也就是不只是解題，而是能否真正撰寫可投入實際使用的程式碼、解決工程問題。

以目前公開資料來看，1656 Elo 已超越 Gemini 3.1 Pro，也高於多數現役頂級模型。

另一項衡量 AI 在真實終端環境執行複雜任務能力的 Terminal-Bench 2.1 中，Gemini 3.5 Flash 得分達 76.2%。

作為對照，OpenAI 於 2025 年初推出 Operator 時，同類測試成績大多仍落在 50% 至 60% 區間。如今提升至 76% 以上，意味著 AI 代理在真實工作場景中的可靠性，正從「勉強能用」邁向「可實際依賴」。

此外，在代理工具調用基準 MCP Atlas 中，Gemini 3.5 Flash 取得 83.6% 成績；多模態推理測試 CharXiv Reasoning 則達 84.2%。

而在 Artificial Analysis 綜合智慧排行榜中，Gemini 3.5 Flash 位於第一象限右上角，也就是同時兼具高智慧水準與高速推理能力的頂尖區域，目前公開模型中僅少數能穩定維持在此區間。

不過，真正讓這次發布引發市場震撼的，並不只是跑分表現，而是其驚人的成本效益。

Gemini 3.5 Flash 的 Token 輸出速度可達其他尖端模型的 4 倍，而在 Antigravity 平台優化版本中，回應速度甚至可達其他競爭者的 12 倍。

然而，在成本方面，Gemini 3.5 Flash 執行 AI 代理任務的費用通常不到其他頂級模型的一半。

根據 Google 估算，若大型科技企業將約 80% 的日常工作負載轉移至 Gemini 3.5 Flash，每年潛在節省金額可超過 10 億美元。

皮查伊也在演講中直言，Flash 最大的優勢，在於它能以不到同級尖端模型一半的成本，提供接近頂級水準的 AI 能力。

Gemini 3.5 最受矚目的架構特性，在於支援多個子代理同步協作，可並行處理複雜業務流程，並維持數週不間斷的自主工作流，不需人工持續介入，適用場景涵蓋稅務申報、客戶盡職調查等高度繁瑣的企業作業。

Google 亦列舉多家企業客戶應用案例：Shopify(SHOP-US) 運用多代理並行分析長周期資料；麥格理銀行（Macquarie Bank）藉此加速客戶開戶並處理逾百頁的法遵文件；Salesforce(CRM-US) 依託其跨步驟工具呼叫能力自動化企業任務等。

分析指出，上述案例揭示 Gemini 3.5 的企業定位，不在於「更聰明」，而在於「更持久、更快速、更低成本地執行長週期任務」。

Gemini 3.5 Flash 即日起已在消費端、開發者端與企業端全面開放，成為 Gemini App 及 Google 搜尋 AI 模式的全球預設模型。

皮查伊同時預告多項產品即將落地：個人 AI 代理 Gemini Spark 下週起向美國 Google AI Ultra 訂閱用戶開放測試；搜尋資訊代理將於 2026 年夏季上線；Android Halo 代理追蹤介面及 AI 音訊眼鏡硬體產品亦分別預計於年底前推出。

‌