【AWS re:invent 2023】黃仁勳現身!NVIDIA GH200 超級晶片夥 AWS 共同推動 GenAI 技術發展

| 李兆城 | 29-11-2023 07:20 | |
【AWS re:invent 2023】黃仁勳現身!NVIDIA GH200 超級晶片夥 AWS 共同推動 GenAI 技術發展

AWS re:invent 2023 中,NVIDIA 創辦人黃仁勳現身,與 AWS 共同發布策略合作,推進生成式人工智能(Generative AI,GenAI)技術的發展。合作聚焦於利用雙方的頂尖技術,包括:NVIDIA新一代的GH200超級晶片和AI軟件,以及AWS的先進虛擬化與安全平台Nitro System、Elastic Fabric Adapter(EFA)互連介面和UltraCluster擴充服務,構建理想的生成式AI應用開發環境。

應用 GH200 超級晶片

AWS推出結合NVIDIA GH200 Grace Hopper Superchip超級晶片和AWS UltraCluster擴充技術的AI超級電腦。此外,NVIDIA率先在AWS上推出採用GH200 NVL32的DGX Cloud方案,為開發者提供AI訓練即服務(AI-training-as-a-service),於單一instance下為開發者提供最大容量的共用記憶體。在 AWS 上運行的 DGX Cloud,將加速訓練擁有超過 1 兆參數的尖端生成式 AI 與大型語言模型。雙方技術的結合,將為生成式AI、高效能運算、設計及模擬工作負載提供顯著效能提升。

Project Ceiba合作更會聯手設計全球最快的GPU驅動AI超級電腦。在GH200 NVL32 與 Amazon EFA 互連技術下,超級電腦將配備16,384顆NVIDIA GH200超級晶片,具備65 exaflops級別的AI運算能力,將由AWS代管,為NVIDIA的研發團隊提供服務。

新增 3 款 EC2 實例

AWS同時推出三款新的Amazon EC2實例,配置不同的NVIDIA GPUs,以應對各種不同的AI和高性能運算需求。其中,P5e實例搭載NVIDIA H200 Tensor Core GPUs,適用於大規模和尖端生成式AI及高效能運算(HPC)工作負載;G6和G6e實例則分別配備NVIDIA L4 GPUs和NVIDIA L40S GPUs,適用於包括AI微調、推論、繪圖和影片工作負載等廣泛應用。

此次策略合作還包括一系列在AWS上運行的NVIDIA軟件,以加速生成式AI的研發。NVIDIA NeMo Retriever微服務為生成式AI提供了多項新工具,而BioNeMo計劃則旨在加快新藥開發過程。AWS利用NVIDIA軟件,包括:訓練新一代的Amazon Titan大型語言模型和利用NVIDIA Omniverse Isaac構建數碼分身以優化無人倉庫的自動化,革新多個領域。

Source:AWS、ezone.hk

 

相關文章

Page 1 of 12