menu-icon
anue logo
馬來西亞房產鉅亨號鉅亨買幣
search icon


科技

AI界核彈引爆!OpenAI發布新Agent模式碾壓第三方工具 Manus們還有活路嗎?

鉅亨網編譯陳韋廷


OpenAI 執行長奧特曼 Sam Altman 在美國時間周四 (17 日) 親自登台揭開 ChatGPT 通用型 Agent 的神秘面紗。在這場直播演示中,Agent 不再局限於對話交互,而是展現出直接完成複雜任務的能力,像是自主訪問網頁、調用終端系統、自動下單購物,甚至能流暢執行從旅行規劃、PPT 製作到圖像生成的全流程操作。

cover image of news article
AI界核彈引爆!OpenAI原生Agent碾壓第三方工具 Manus們還有活路嗎?(圖:Shutterstock)

專家指出,這些動作看似與數月前爆紅的 Manus 平台功能高度相似,但核心差異在於,OpenAI 將此類能力深度整合為 ChatGPT 的原生系統功能,而非依賴外部工具呼叫。


根據 OpenAI 官方介紹,新發布的 Agent 模式即日起對 Pro、Plus 和 Team 版用戶開放,每月分別提供 400 次和 40 次任務執行額度,而 Enterprise 和 Education 版用戶也將於 7 月獲得使用權限。「

這項系統級能力的背後是兩項關鍵技術的深度融合,Operator 視覺層交互代理負責「動手操作」,Deep Research 多步驟網頁推理擅長「動腦決策」,兩者結合使 Agent 具備了真正的任務理解、資訊整合與策略優化能力。

更值得關注的是,文字瀏覽器、視覺化瀏覽器及終端工具三大模組的協同支持,讓 Agent 能在 ChatGPT 內建的虛擬運算環境中統一調度運行,實現跨工具協同、自主策略選擇與狀態上下文的無縫銜接。使用者不僅能隨時調整指令或暫時接管任務,Agent 還能在每一步動態評估執行效果,並選擇最優路徑。

在多項基準測試中,OpenAI Agent 展現出超越同類產品的表現表現。在涵蓋歷史、哲學、經濟等學科的「人類最後的考試」中,得分達 43.1 分,較未使用工具的 o3 模型提升一倍。

在 DSBench 測試裡,OpenAI Agent 的數據分析、建模及圖表生成能力超過所有開源模型,部分已優於人類中位等級的實驗量評分,WebArena 網頁操作任務則接近人類平均,資訊檢索能力更在 BrowseComp 基準中創下 68.9 分的當前紀錄。

然而,市場回饋呈現兩極化。部分媒體盛讚這是 AI 應用模式從「對話助理」邁向「任務代理人」的里程碑,但也有從業人士和網友質疑其實際體驗「雷聲大雨點小」。

上述爭議背後折射出 Agent 賽道競爭格局的劇變。就在數月前,國產平台 Manus 曾憑藉類似功能引發廣泛關注,但其官網近期悄悄關閉中國大陸業務,僅保留海外產品線,創始團隊也被曝光。

投資機構朱嘯虎先前公開斷言「大模型會吃掉 90% 的 Agent」,如今 OpenAI 的強勢入局似乎正在驗證這一判斷。

產業觀察人士指出,OpenAI 此次發布不僅是一次功能升級,更重新定義遊戲規則,將原本需要第三方工具拼接的複雜任務執行能力轉化為系統原生功能,大幅降低用戶的使用門檻與技術成本。對 Manus 等新創公司而言,窗口期正以超預期的速度縮小。

當大模型廠商以算力、數據與生態優勢直接下場,通用型 Agent 的創業賽道恐將迎來更殘酷的洗牌,留給後來者的時間與空間或許比想像中更加急迫。在這場由科技巨頭主導的競賽中,如何尋找差異化生存路徑,將成為所有參與者必須面對的課題。



Empty