重磅!DeepSeek-R1升級版正式開源 性能直逼o3、o4 編程強到離譜!
鉅亨網新聞中心

科技界對 DeepSeek 即將推出的 R2 模型充滿期待。然而,迄今為該模型的神秘面紗仍未揭開。 DeepSeek 周三 (28 日) 突然宣布其 R1 車型已完成小版試升級,並將其權重上傳至 HuggingFace。使用者可前往官方網頁、APP 及小程式進行測試,API 介面及使用方式維持不變。
儘管 DeepSeek 並未詳細公佈此次版本更新的具體內容,但回顧今年 3 月,DeepSeek 曾對 V3 模型進行小版本升級,並透過官方交流群提前發布了相關資訊。關於 R2 模型的傳聞也不斷湧現,有消息指出其參數規模可能達到驚人的 1.2 兆,幾乎是前代 R1 模型 6710 億參數的兩倍。然而,這項說法至今仍未獲得官方確認。
此模型的性能幾乎與 o4-mini(Medium)相當,甚至在程式設計實測中超越了 Claude 4 Sonnet,贏得了網友們的廣泛讚譽,認為開源再次取得了重大勝利。
DeepSeek-R1-0528 模型的開源標誌著該專案經過四個月的超進化,編碼能力顯著提升,思考時間延長。據悉,新模型基於 DeepSeek-V3-0324 進行訓練,參數達 660B。在經典物理模擬測試中,DeepSeek-R1 的新舊版本表現出色,在 LiveCodeBench 基準測試中,其性能幾乎與 o3-mini(High)和 o4-mini(Medium)相當,並一舉超越了 Gemini 2.5 Flash。
用戶們對 DeepSeek-R1 的深度推理能力表示讚賞,稱其能夠像谷歌模型一樣進行複雜的思維鏈糾正,並且在創造性任務中表現出色。
新版模型的核心亮點包括文字生成優化,使生成的內容更加自然且格式優雅,獨特的推理風格不僅快速且更為纈密,並支援長時間思考,單任務處理時長可達 30-60 分鐘。
在程式設計能力方面,DeepSeek-R1 展現出驚人的表現。使用者在實測中發現,該模型在程式設計任務中表現優異,能夠一次產生高品質的程式碼,且無需進行任何編輯或重試。這項特性在過去的模型中極為少見,使用者普遍認為 DeepSeek-R1 在前端編碼能力上超越了 Claude 4 Sonnet。
此外,DeepSeek-R1 在處理複雜推理問題時表現同樣出色。針對一個涉及多步驟思考的經典問題,模型能夠有效給出解決方案,展示了其強大的邏輯推理能力。使用者對其思考過程的穩定性和準確性表示驚訝,認為模型在算力方面也有顯著提升,能夠在高峰測試期內保持良好的表現。
整體來看,DeepSeek-R1 的發布不僅標誌著開源模型的重大勝利,也為後續的 AI 發展奠定了堅實基礎。隨著更多用戶的實測回饋,DeepSeek-R2 的期待值也隨之上升,未來的模式更新將更加令人期待。
延伸閱讀
上一篇
下一篇