Google發布Gemini 3.5 Flash!成本砍半、速度快4倍
鉅亨網新聞中心
在今日舉行的 Google(GOOGL-US) I/O 2026 開發者大會上,公司執行長皮查伊(Sundar Pichai)正式發表新一代大型語言模型系列 Gemini 3.5,首發推出 Gemini 3.5 Flash,並定位為「至今為止最強大的代理與程式設計模型」。

根據《CNBC》報導,皮查伊(Sundar Pichai)形容 Gemini 3.5 Flash「速度驚人」,其價格僅為同級頂尖模型的二分之一,甚至低至三分之一。
Google 表示,3.5 Flash 即日起將成為全球 Gemini 應用程式及搜尋 AI 模式的預設模型,讓使用者「不必再為了速度而犧牲品質」。
此外,該模型的資安防護也同步強化,降低產生有害內容或誤拒合理提問的機率。不過,較重量級的 Gemini 3.5 Pro 目前仍在內部使用,預計下個月才會對外開放。
數據上,在 GDPval-AA 測試中,Gemini 3.5 Flash 拿下 1656 Elo 分數。這項基準主要評估模型處理「具真實商業價值的程式開發任務」能力,也就是不只是解題,而是能否真正撰寫可投入實際使用的程式碼、解決工程問題。
以目前公開資料來看,1656 Elo 已超越 Gemini 3.1 Pro,也高於多數現役頂級模型。
另一項衡量 AI 在真實終端環境執行複雜任務能力的 Terminal-Bench 2.1 中,Gemini 3.5 Flash 得分達 76.2%。
作為對照,OpenAI 於 2025 年初推出 Operator 時,同類測試成績大多仍落在 50% 至 60% 區間。如今提升至 76% 以上,意味著 AI 代理在真實工作場景中的可靠性,正從「勉強能用」邁向「可實際依賴」。
此外,在代理工具調用基準 MCP Atlas 中,Gemini 3.5 Flash 取得 83.6% 成績;多模態推理測試 CharXiv Reasoning 則達 84.2%。
而在 Artificial Analysis 綜合智慧排行榜中,Gemini 3.5 Flash 位於第一象限右上角,也就是同時兼具高智慧水準與高速推理能力的頂尖區域,目前公開模型中僅少數能穩定維持在此區間。
不過,真正讓這次發布引發市場震撼的,並不只是跑分表現,而是其驚人的成本效益。
Gemini 3.5 Flash 的 Token 輸出速度可達其他尖端模型的 4 倍,而在 Antigravity 平台優化版本中,回應速度甚至可達其他競爭者的 12 倍。
然而,在成本方面,Gemini 3.5 Flash 執行 AI 代理任務的費用通常不到其他頂級模型的一半。
根據 Google 估算,若大型科技企業將約 80% 的日常工作負載轉移至 Gemini 3.5 Flash,每年潛在節省金額可超過 10 億美元。
皮查伊也在演講中直言,Flash 最大的優勢,在於它能以不到同級尖端模型一半的成本,提供接近頂級水準的 AI 能力。
Gemini 3.5 最受矚目的架構特性,在於支援多個子代理同步協作,可並行處理複雜業務流程,並維持數週不間斷的自主工作流,不需人工持續介入,適用場景涵蓋稅務申報、客戶盡職調查等高度繁瑣的企業作業。
Google 亦列舉多家企業客戶應用案例:Shopify(SHOP-US) 運用多代理並行分析長周期資料;麥格理銀行(Macquarie Bank)藉此加速客戶開戶並處理逾百頁的法遵文件;Salesforce(CRM-US) 依託其跨步驟工具呼叫能力自動化企業任務等。
分析指出,上述案例揭示 Gemini 3.5 的企業定位,不在於「更聰明」,而在於「更持久、更快速、更低成本地執行長週期任務」。
Gemini 3.5 Flash 即日起已在消費端、開發者端與企業端全面開放,成為 Gemini App 及 Google 搜尋 AI 模式的全球預設模型。
皮查伊同時預告多項產品即將落地:個人 AI 代理 Gemini Spark 下週起向美國 Google AI Ultra 訂閱用戶開放測試;搜尋資訊代理將於 2026 年夏季上線;Android Halo 代理追蹤介面及 AI 音訊眼鏡硬體產品亦分別預計於年底前推出。
延伸閱讀
- Google I/O登場!自家版龍蝦Spark、Gemini模型Omini、3.5 Flash正式亮相
- 輝達現金滿手!自由現金流上看1900億美元 市場聚焦庫藏股與AI布局
- 輝達財報後4次有3次股價下跌!現在該買入嗎?分析師點出「一重點」
- 輝達與亞馬遜聯手顛覆AI架構!GPU將直接控制SSD、HBF有望取代部分HBM需求
- 講座
- 公告
下一篇