menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

美股

Google搶先發布Gemini 2.5 Pro預覽版:AI 影片理解大升級、直接處理6小時長片

鉅亨網編譯莊閔棻 2025-05-10 19:00

cover image of news article
Google搶先發布Gemini 2.5 Pro,AI 影片理解大升級、影片直接變教材。(圖:Shutterstock)

在年度 Google I/O 2025 開發者大會正式開幕前,Google (GOOGL-US) 搶先釋出全新 AI 模型 Gemini 2.5 Pro Preview(I/O 特別版),主打影片理解、程式輔助與網頁開發三大應用,強化其在生成式 AI 市場的領先地位。

Gemini 2.5 首度突破原生多模態(Multimodal)處理極限,可無縫整合分析影片、音訊、圖像、文字與程式碼等資料格式,不只是「看懂影片」,更能深入理解內容並生成高品質輸出,例如即時摘要或互動解說。


Gemini 2.5 不只能「看懂影片」,還能深入理解內容並生成高品質輸出。(圖:Shutterstock)
Gemini 2.5 Pro 能深入理解影片內容,生成互動摘要與教學章節,強化教育與知識型應用場景。(圖:Shutterstock)

在影片理解領域,Gemini 2.5 Pro 於 VideoMMe 基準測試中獲得 84.8% 高分,表現超越多項同類模型。

無論是教育影片還是一般影片,Gemini 都能「自動劃重點」,甚至一口氣處理最長 6 小時影片內容,並轉化成可互動網頁、問答介面或教學摘要,大幅簡化使用者學習與吸收資訊的流程。

此新版本還強調「影片秒變教材」的能力。用戶可將任意影片交給 Gemini 處理,AI 自動分析影片架構與重點章節,並轉化為互動式教學網站,提供章節分類、內容問答與摘要導覽,特別適合教育平台、知識型 YouTuber 或企業培訓使用。

除了影片功能,Gemini 2.5 Pro 在軟體開發支援也有顯著提升:包含程式碼生成、函式呼叫、除錯建議與錯誤修正。根據 Google,該模型在 Elo 測試分數上比前一版本大幅成長 147 分,更在 WebArena 網頁開發排行榜中奪冠。

Gemini 2.5 Pro 已透過 Gemini API、Google AI Studio、Vertex AI、Gemini 網頁與行動版應用程式 開放預覽使用。Google 表示將依據用戶回饋進一步優化模型表現,並預計在 I/O 大會中公佈更多整合細節與新功能。

Gemini 2.5 Pro 的推出正值全球生成式 AI 模型戰火激烈之際。除了 Google 外,OpenAI 的 GPT-4 系列、Anthropic 的 Claude、Meta (META-US) 的 Llama 3 等技術大廠也積極擴展其基礎模型應用,爭奪下一波 AI 競爭主導權。



    Empty