鉅亨網編譯羅昀玫
中國人工智慧新創 DeepSeek 於週五 (24 日) 發布新一代 AI 模型 V4 預覽版,該模型針對「華為」晶片架構進行優化,象徵中國在關鍵算力基礎上加速擺脫對外依賴;而輝達執行長黃仁勳先前已警告,一旦中國 AI 模型全面轉向本土晶片運行,恐對美國帶來「可怕的結果」,相關發展正牽動全球科技與資本市場神經。
DeepSeek 週五表示,V4 的 Pro 版本在世界知識基準測試中優於多數開源模型,僅次於 Google (GOOGL-US) 的閉源模型 Gemini-Pro-3.1。公司指出,新模型特別適用於 AI 代理 (AI agent) 任務,可處理更複雜的工作流程,但同時對算力需求較高。
此次 DeepSeek 與華為合作深化,與過去高度依賴輝達 (NVDA-US) 晶片形成對比。華為表示,其 Ascend 晶片已參與 V4 部分訓練過程,顯示中國 AI 模型逐步轉向本土硬體體系。
這一發展對全球 AI 產業格局具有指標意義。在美國出口管制與中國政策推動下,企業正加速降低對外國技術依賴,轉向自研與國產替代方案。
黃仁勳近日在 Dwarkesh podcast 上發出警告,若中國開發者轉向本土平台,可能削弱公司在中國市場的生態優勢。
他強調:「DeepSeek 並非微不足道的進步。如果有一天 DeepSeek 首度在華為晶片上發佈,那將是對我們國家 (美國) 而言一個可怕的結果。」他指出,全球的 AI 模型若非在美國硬體上運行,對美國將是壞消息。
如今,隨著 DeepSeek 選擇優先適配華為晶片,市場對此趨勢的關注持續升溫。
從產品表現來看,DeepSeek V4 已在機器學習平台 Hugging Face 快速登上熱門榜首,具備處理超長文本的能力,最多可支援超過百萬 Token,與目前主流頂級模型相當,同時在成本上更具競爭力。不過,該模型目前尚不支援影像與影片等多模態功能。
白宮日前指控中國大規模取得美國 AI 技術,相關爭議持續升溫。
此時 DeepSeek 發布新模型,也正值美國總統川普預計下月訪問北京之前,科技與地緣政治議題交織。
受到 DeepSeek V4 利多消息催動,陸股晶片族群應聲走強。華虹半導體與中芯國際 (0981-HK) 週五分別大漲 15% 與 10%,反映市場預期本土晶片應用將進一步擴大。
另一方面,輝達 (NVDA-US) 週五同步走高 4.32% 至每股 208.37 美元,市值超過 5.06 兆美元,主要受英特爾 (INTC-US) 釋出強勁財測帶動,顯示 AI 需求動能仍然強勁。
不過,DeepSeek 在中國市場面臨的競爭日益激烈。
V4 發布後,競爭對手智譜 AI (2513-HK) 與 MiniMax (0100-HK) 股價均下跌約 9%,顯示市場對其新模型競爭力的即時反應。
DeepSeek 指出,V4 目前為預覽版本,將持續根據實際使用回饋進行優化,尚未公布正式推出時程。公司亦推出成本更低的 Flash 版本,以擴大市場應用場景。
據報導,DeepSeek 母公司正尋求以超過 200 億美元估值進行新一輪募資,並與阿里巴巴 (9988-HK) 與騰訊 (0700-HK) 洽談入股事宜,顯示大型科技企業對 AI 布局持續加碼。
上一篇
下一篇
