menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon


美股

OpenAI 推出「Deep Research」 AI研究能力再升級

鉅亨網新聞中心


OpenAI 周日 (2 日) 發布了一項名為「Deep Research」的全新 AI 功能,這項功能旨在協助使用者進行深入、複雜的研究,其目標是讓 AI 能夠像人類專家一樣,獨立完成耗時的研究工作。

cover image of news article
OpenAI 推出「Deep Research」 AI研究能力再升級(圖:shutterstock)

OpenAI 在周日發布的部落格文章強調,「Deep Research」專為需要在金融、科學、政策和工程等領域進行密集知識工作的使用者而設計,同時也適用於需要仔細研究的購物決策,例如汽車、家電和家具等。


特別對外展示「Deep Research」

OpenAI 研究負責人 Mark Chen 帶領三位工作人員,在 20 多分鐘內詳細展示了 Deep Research 的功能。

最大亮點之一:只要數十分鐘,它就能完成人類專家花費幾小時的複雜調查任務。Chen 稱之為「我們的下一代智慧體產品」。

「Deep Research」的主要特色

OpenAI 指出,「Deep Research」是基於優化版的 o3 模型打造,這個版本專為網路瀏覽和資料分析而設計。

OpenAI 表示,此版本的 o3「針對網頁瀏覽和數據分析進行了優化」,並補充稱,「它利用推理來搜索、解釋和分析互聯網上的大量文本、圖像和 PDF,並根據需要根據信息做出反應它遇到了。該公司表示,該模型「還能夠瀏覽用戶上傳的文件」,並「使用 [Python] 工具繪製和迭代圖形,在其回應中嵌入生成的圖形和網站圖像,並引用特定的句子或摘自其來源段落。

OpenAI 表示,它使用 Humanity 的 Last Exam 測試了 ChatGPT 深度研究,該評估包括各個學術領域的 3,000 多個專家級問題。

支持深度研究的 o3 模型實現了 26.6% 的準確率,這看起來像是一個不及格的分數——但人類的最後考試旨在比其他基準更為嚴格,以保持領先於模型進步。

根據 OpenAI 的數據,深度研究 o3 模型遠遠領先 Gemini Thinking(6.2%)、Grok-2(3.8%) 和 OpenAI 自己的 GPT-4o(3.3%)。

不過,OpenAI 指出,ChatGPT 深度研究有其局限性,有時會犯錯和不正確的推論。該公司表示,深入研究可能難以區分權威訊息和謠言,並且經常無法傳達不確定的訊息,而且還可能在報告和引文中出現格式錯誤。

未來發展

OpenAI 計畫在未來幾周內,在報告中添加嵌入式圖片、資料視覺化和其他分析輸出。此外,也將加入連接更專業的資料來源的功能,例如學術期刊或企業內部資源。OpenAI 的最終目標是結合「Deep Research」與「Operator」(負責實際行動執行) 的功能,讓 ChatGPT 能夠執行更複雜的任務,成為個人化的 AI 助手。



Empty