亞馬遜(AMZN-US)旗下AWS本周舉辦re:Invent大會,會中宣布,將與輝達(NVDA-US)擴大策略合作,在互連技術、雲端基礎架構、開放模型及物理AI等領域開展全新技術整合。AWS宣布,將支援NVIDIANVLinkFusion部署於自家晶片,其中包括用於推論與具代理型AI模型訓練的次世代Trainium4晶片、涵蓋廣泛工作負載的GravitonCPU,以及NitroSystem虛擬化基礎架構。藉由採用NVIDIANVLinkFusion,AWS將結合NVIDIANVLink垂直擴展互連技術、NVIDIAMGX機架架構與AWS客製化晶片,以提升效能並加速其新一代雲端規模AI能力的上市時程。AWS正以整合NVLink與NVIDIAMGX為目標設計Trainium4,這是NVIDIA與AWS針對NVLinkFusion展開多世代長期合作中的第一步。AWS已經大規模部署搭載NVIDIAGPU的MGX機架。導入NVLinkFusion將使AWS能進一步簡化各平台的部署與系統管理。AWS也可以運用NVLinkFusion供應商生態系,取得從機架與機箱到電力供應與冷卻系統等完整元件,滿足整機架部署所需。透過支援AWSElasticFabricAdapter與NitroSystem,AWS上的NVIDIAVeraRubin架構將在維持與AWS雲端基礎架構完全相容的同時,為客戶提供更強大的網路選項,加速全新AI服務的推出。輝達創辦人暨執行長黃仁勳表示,GPU運算需求正急遽攀升。更多的運算造就更聰明的AI,更聰明的AI帶動更廣泛的應用,而更廣泛的應用又帶動對更多運算的需求,AI的良性循環已經成形。隨著NVLinkFusion導入AWSTrainium4,正把輝達垂直擴展架構與AWS的客製化晶片整合,打造新一代加速運算平台。雙方正攜手打造支撐AI產業革命的運算基礎,將先進AI帶到世界各國的每一家企業,加速世界邁向智慧化。AWS執行長MattGarman表示,雙方攜手合作已超過15年,如今這段旅程再寫下新的里程碑。透過與輝達合作,公司正推進大規模AI基礎架構,為客戶帶來更高的效能、效率與擴充性。未來在AWSTrainium4、Graviton與NitroSystem上支援NVIDIANVLinkFusion,將為客戶提供全新能力,讓他們能以前所未有的速度創新。AWS透過包括NVIDIAHGXB300及NVIDIAGB300NVL72GPU在內的NVIDIABlackwell架構,擴充其加速運算產品組合,讓客戶能立即使用業界最先進的訓練與推論GPU。為視覺應用打造的NVIDIARTXPRO6000Blackwell伺服器版本GPU也預計在未來數週於AWS上提供。這些GPU將成為AWS基礎架構的支柱一部分,為全新AWSAIFactories服務提供動能。AWSAIFactories是一項全新AI雲端服務,將在由AWS代管的客戶自有資料中心中,提供專用的基礎架構,協助全球客戶掌握先進AI服務與能力,同時維持對自身資料的掌控權並遵循各地法規。NVIDIA與AWS承諾在全球部署主權AI雲,將最先進的AI創新帶給世界各地。隨著AWSAIFactories上線,雙方將提供安全且符合主權要求的AI基礎架構,在滿足日益嚴格的主權AI規範同時,為全球各類型組織帶來前所未有的運算能力。對公部門機構而言,AWSAIFactories將重塑美國聯邦級高效能運算與AI版圖。採用AWSAIFactories的客戶,將能把以可靠性、安全性與可擴展性著稱的AWS業界領先雲端基礎架構與服務,與NVIDIABlackwellGPU及涵蓋NVIDIASpectrum-X乙太網路交換器在內的NVIDIA全端加速運算平台無縫整合。這套統一的架構可確保客戶在維持對專有資料的完全掌控並完全遵循在地監管框架的前提下,存取先進AI服務與能力,並訓練與部署超大規模模型。NVIDIANemotron與AmazonBedrock整合,擴大軟體最佳化效益除硬體方面外,此次合作也擴大了NVIDIA軟體堆疊與AWSAI生態系的整合。NVIDIANemotron開放模型現已整合至AmazonBedrock,協助客戶建置生產級生成式AI應用與智慧代理。開發者可使用NemotronNano2與NemotronNano2VL,打造以高效率、高精準處理文字、程式碼、影像與影片的專用代理型AI應用。此次整合讓高效能的NVIDIA開放模型可以在AmazonBedrock的無伺服器平台上立即存取,客戶仰賴其經驗證的擴充性與零基礎架構管理能力。業界領導廠商CrowdStrike與BridgeWise已率先採用這項服務部署專用AI智慧代理。NVIDIA軟體在AWS上簡化開發者體驗NVIDIA與AWS也在軟體層共同開發,加速每一家企業的資料支柱。AmazonOpenSearchService現已提供向量索引建置的無伺服器GPU加速能力。這是以NVIDIAcuVS這套用於GPU加速向量搜尋與資料分群的開源函式庫。這項里程碑標誌著非結構化資料處理開始根本性轉向GPU。早期採用者已看到向量索引速度最高提升10倍,同時成本降至原先的四分之一。這樣顯著的效能提升,透過在正確時間提供剛好所需的GPU運算能力,降低搜尋延遲、加快寫入速度,並讓檢索增強生成(RAG)等動態AI技術能以更高生產力運作。AWS也是首家提供結合NVIDIAGPU的無伺服器向量索引服務的大型雲端供應商。要打造可投入實際運行的AI智慧代理,必須具備效能可視化、最佳化能力與可擴展的基礎架構。結合用於代理開發與協調的StrandsAgents、用於深度剖析與效能調校的NVIDIANeMoAgentToolkit,以及提供安全且可擴展代理基礎架構的AmazonBedrockAgentCore,企業即可為開發者提供從原型到量產部署的完整且可預期路徑。這項支援的擴充建立在AWS既有的NVIDIA技術整合基礎上,包括NVIDIANIM微服務,以及NVIDIARiva與NVIDIABioNeMo等框架,同時也涵蓋已與AmazonSageMaker與AmazonBedrock整合的模型開發工具。透過這些整合,企業能以前所未有的速度部署代理型AI、語音AI與科學應用。攜手AWS加速物理AI發展物理AI需要高品質且多樣化的資料集來訓練機器人模型,同時也仰賴在實際部署前,透過模擬環境進行測試與驗證的框架。NVIDIACosmos世界基礎模型(WFM)現已在AmazonEKS上以NVIDIANIM微服務形式提供,可在雲端原生架構下,以高可靠性支援即時機器人控制與模擬工作負載。針對大量批次任務與離線工作負載,例如大規模合成資料產生,CosmosWFM也能在AWSBatch上以容器方式提供。Cosmos生成的世界狀態可搭配NVIDIAIsaacSim與IsaacLab等開源模擬與學習框架,用於訓練與驗證機器人。包括AgilityRobotics、AgileRobots、ANYbotics、DiligentRobotics、DynaRobotics、FieldAI、HaplyRobotics、Lightwheel、RIVR與SkildAI等領先機器人公司,正透過NVIDIAIsaac平台結合AWS,應用於多種情境,從機器人資料的收集、儲存與處理,到訓練與模擬,以擴展機器人開發規模。NVIDIA今年獲頒AWSGlobalGenAIInfrastructureandDataPartneroftheYear大獎,印證雙方多年持續合作的成果。此獎項表揚具備生成式AI能力、並在多種型態與格式上支援向量嵌入、資料儲存與管理,或合成資料產生的頂尖技術合作夥伴。