美股

重磅！DeepSeek-R1升級版正式開源性能直逼o3、o4 編程強到離譜！

鉅亨網新聞中心2025-05-29 11:00

科技界對 DeepSeek 即將推出的 R2 模型充滿期待。然而，迄今為該模型的神秘面紗仍未揭開。 DeepSeek 周三 (28 日) 突然宣布其 R1 車型已完成小版試升級，並將其權重上傳至 HuggingFace。使用者可前往官方網頁、APP 及小程式進行測試，API 介面及使用方式維持不變。

cover image of news article — （圖：REUTERS/TPG）

儘管 DeepSeek 並未詳細公佈此次版本更新的具體內容，但回顧今年 3 月，DeepSeek 曾對 V3 模型進行小版本升級，並透過官方交流群提前發布了相關資訊。關於 R2 模型的傳聞也不斷湧現，有消息指出其參數規模可能達到驚人的 1.2 兆，幾乎是前代 R1 模型 6710 億參數的兩倍。然而，這項說法至今仍未獲得官方確認。

‌

此模型的性能幾乎與 o4-mini（Medium）相當，甚至在程式設計實測中超越了 Claude 4 Sonnet，贏得了網友們的廣泛讚譽，認為開源再次取得了重大勝利。

DeepSeek-R1-0528 模型的開源標誌著該專案經過四個月的超進化，編碼能力顯著提升，思考時間延長。據悉，新模型基於 DeepSeek-V3-0324 進行訓練，參數達 660B。在經典物理模擬測試中，DeepSeek-R1 的新舊版本表現出色，在 LiveCodeBench 基準測試中，其性能幾乎與 o3-mini（High）和 o4-mini（Medium）相當，並一舉超越了 Gemini 2.5 Flash。

用戶們對 DeepSeek-R1 的深度推理能力表示讚賞，稱其能夠像谷歌模型一樣進行複雜的思維鏈糾正，並且在創造性任務中表現出色。

新版模型的核心亮點包括文字生成優化，使生成的內容更加自然且格式優雅，獨特的推理風格不僅快速且更為纈密，並支援長時間思考，單任務處理時長可達 30-60 分鐘。

在程式設計能力方面，DeepSeek-R1 展現出驚人的表現。使用者在實測中發現，該模型在程式設計任務中表現優異，能夠一次產生高品質的程式碼，且無需進行任何編輯或重試。這項特性在過去的模型中極為少見，使用者普遍認為 DeepSeek-R1 在前端編碼能力上超越了 Claude 4 Sonnet。

此外，DeepSeek-R1 在處理複雜推理問題時表現同樣出色。針對一個涉及多步驟思考的經典問題，模型能夠有效給出解決方案，展示了其強大的邏輯推理能力。使用者對其思考過程的穩定性和準確性表示驚訝，認為模型在算力方面也有顯著提升，能夠在高峰測試期內保持良好的表現。

整體來看，DeepSeek-R1 的發布不僅標誌著開源模型的重大勝利，也為後續的 AI 發展奠定了堅實基礎。隨著更多用戶的實測回饋，DeepSeek-R2 的期待值也隨之上升，未來的模式更新將更加令人期待。

‌