鉅亨網編譯許家華
輝達 (NVDA-US) 在年度 GTC 大會上宣布推出全新的 BlueField-4 STX 儲存架構,主打為需要長上下文推理能力的人工智慧 (AI) 工作負載打造,試圖解決大型 AI 模型在運算與資料存取上的瓶頸。公司表示,隨著 AI 系統逐步走向能夠長時間推理與持續學習的新階段,資料儲存與運算基礎架構也必須同步升級。
根據輝達發布的新聞稿,STX 參考架構相較於傳統儲存系統,最高可提供 5 倍的 Token 吞吐量,能源效率最高提升 4 倍,企業 AI 資料的匯入速度也可提升 2 倍。這套架構的核心目標是支援需要大量上下文記憶與高速資料存取的 AI 模型,尤其是近年快速發展的長上下文推理系統。
STX 架構整合輝達的 CMX 上下文記憶儲存平台,該平台透過高效能的上下文層來擴展 GPU 記憶體容量,使 AI 模型能夠處理更大規模的資料與更長的推理上下文。整體系統採用 BlueField-4 處理器,結合輝達 Vera CPU 與 ConnectX-9 SuperNIC,並搭配 Spectrum-X 乙太網路架構,以提供高速資料傳輸與運算能力。
輝達創辦人兼執行長黃仁勳表示:「Agentic AI 正在重新定義軟體的能力,而支撐這些系統的運算基礎架構也必須重新設計。能夠在龐大上下文中進行推理並持續學習的 AI 系統,需要一種全新的儲存架構。」
目前已有多家雲端與 AI 基礎設施企業計畫採用 STX 架構作為上下文記憶儲存解決方案,早期採用者包括 CoreWeave、Crusoe、IREN、Lambda、Mistral AI、Nebius、Oracle Cloud Infrastructure 以及 Vultr 等。
同時,多家儲存與系統製造商也將基於 STX 設計開發相關基礎設施產品,包括 AIC、Cloudian、DDN、戴爾科技 (DELL-US)、Everpure、Hitachi Vantara、慧與科技 (HPE-US)、IBM(IBM-US)、MinIO、NetApp(NTAP-US)、Nutanix(NTNX-US)、美超微 (SMCI-US)、Quanta Cloud Technology、VAST Data 以及 WEKA 等。
輝達表示,基於 STX 架構打造的平台預計將由合作夥伴於今年下半年正式推出,未來將用於支援需要長上下文推理能力的新一代 AI 系統與大型模型應用。
下一篇
