英偉達(dá)再推超級芯片，快過H100，打臉大摩“泡沫”論

由微新創(chuàng)想 · 2023年 8月 10日

編者按：本文來自微信公眾號硅基研究室（ID：gh_cef05ac13977），作者：白嘉嘉，微新創(chuàng)想經(jīng)授權(quán)轉(zhuǎn)載

摩根士丹利分析師剛給英偉達(dá)貼上“泡沫”的標(biāo)簽，英偉達(dá)就拿出了最新一代GH 200 Grace Hopper超級芯片平臺，證明這股AI熱并非搖搖欲墜的空中樓閣。

美東時間8月8日，在洛杉磯的SIGGRAPH大會上，英偉達(dá)發(fā)布新一代GH200 Grace Hopper超級芯片平臺，該平臺依托于搭載全球首款HBM3e處理器的Grace Hopper超級芯片（后稱GH200）。

英偉達(dá)再推超級芯片，快過H100，打臉大摩“泡沫”論插圖

圖源：SIGGRAPH大會

英偉達(dá)表示，新平臺旨在處理世界上最復(fù)雜的生成式AI工作負(fù)載，涵蓋大型語言模型、推薦系統(tǒng)和矢量數(shù)據(jù)庫，將提供多種配置。

除了超級芯片平臺，英偉達(dá)還發(fā)布了5款硬件新品和簡化企業(yè)級AI開發(fā)過程的AI workbench服務(wù)等內(nèi)容。

其中，5款硬件新品分別是搭載全新L40S Ada GPU的新款OVX服務(wù)器、搭載RTX 6000 Ada GPU的全新RTX工作站，以及3款高端桌面工作站GPU。

超級芯片GH200，大小模型都能用

本次發(fā)布會上，黃仁勛照舊搬出了那句標(biāo)志性的促銷口號，“買得越多，省得越多”。

同樣花1億美金，過去能買8800塊x86 CPU組成的數(shù)據(jù)中心，功耗是5MV。

在GH200面世后，這1億美金發(fā)揮出了更大的價值。通過購買2500塊GH200組成的Ios-Budget數(shù)據(jù)中心，不僅可以將功耗降低到3MV，AI推理性能更是達(dá)到了前者的12倍，折合能效提升20倍。

同等推理性能的情況下，Iso-Troughput數(shù)據(jù)中心只需用到210塊GH200，功耗是0.26MW，成本只有x86 CPU數(shù)據(jù)中心的二分之一，僅800萬美元。

英偉達(dá)再推超級芯片，快過H100，打臉大摩“泡沫”論插圖1

圖源：SIGGRAPH大會

即便和英偉達(dá)的拳頭產(chǎn)品——在eBay上漲到4.5萬美元的H100相比，GH200的表現(xiàn)同樣讓人驚艷。

基于全球最快內(nèi)存HBM3e，GH 200內(nèi)存容量高達(dá)141GB，提供每秒5TB的帶寬。每個GPU容量達(dá)到H100的1.7倍，帶寬達(dá)1.55倍。

對于行業(yè)來說，更大的容量和更高的運行速度，意味著未來可以讓模型駐留在單個GPU上，而不必需要多個系統(tǒng)或GPU才能運行。

但這并不意味著GH 200就不適用于生成式AI的巨型模型，英偉達(dá)新發(fā)布的NVIDIA NVLink?服務(wù)器設(shè)計，對GH200進(jìn)行了拓展。

NVIDIA NVLink?將允許Grace Hopper超級芯片可以與其他超級芯片連接組合，這一技術(shù)方案為GPU提供了完全訪問CPU內(nèi)存的途徑。

同時，英偉達(dá)表示，目前正在開發(fā)一款新的雙GH200基礎(chǔ)NVIDIA MGX服務(wù)器系統(tǒng)，將集成兩個下一代Grace Hopper超級芯片。

在新的雙GH200服務(wù)器中，系統(tǒng)內(nèi)的CPU和GPU將通過完全一致的內(nèi)存互連進(jìn)行連接，這個超級GPU可以作為一個整體運行，提供144個Grace CPU核心、8千萬億次的計算性能以及282GB的HBM3e內(nèi)存。

AI Workbench，讓人人都能做大模型

除了全新的超級芯片平臺，另一項對行業(yè)起到促進(jìn)作用的內(nèi)容是AI Workbench。

英偉達(dá)認(rèn)為，當(dāng)前企業(yè)級AI的開發(fā)過程太過繁瑣和復(fù)雜，不僅需要在多個庫中尋找合適的框架和工具，當(dāng)項目需要從一個基礎(chǔ)設(shè)施遷移到另一個基礎(chǔ)設(shè)施時，過程可能會變得更加具有挑戰(zhàn)性。

簡單來說，AI Workbench實現(xiàn)了企業(yè)級模型的快速打包和搬運，讓開發(fā)者既可以在個人電腦、筆記本電腦或工作站上快速創(chuàng)建、測試和定制生成式AI模型，也可以在必要時重新將其拓展到數(shù)據(jù)中心、公有云或NVIDIA DGX Cloud。

具體到使用上，AI Workbench提供了一個簡單的用戶界面，開發(fā)人員能夠?qū)⒛Ｐ?、框架、SDK等信息從開源資源整合到統(tǒng)一的工作區(qū)中，可以在本地計算機上運行并連接到HuggingFace、Github以及其它流行開源或商用AI代碼儲存庫。

英偉達(dá)再推超級芯片，快過H100，打臉大摩“泡沫”論插圖2

圖源：SIGGRAPH大會

英偉達(dá)表示，使用 AI Workbench 的一些主要優(yōu)勢包括：

易于使用的開發(fā)平臺。AI Workbench 通過提供單一平臺來管理數(shù)據(jù)、模型和計算資源，支持跨機器和環(huán)境的協(xié)作，從而簡化了開發(fā)流程。

與 AI 開發(fā)工具和存儲庫集成。AI Workbench 與 GitHub、NVIDIA NGC 和 Hugging Face 等服務(wù)和 Git 服務(wù)器集成，用戶可以使用 JupyterLab 和 VS Code 等工具跨平臺和基礎(chǔ)設(shè)施進(jìn)行開發(fā)，具有高度的可重復(fù)性和透明度。

增強協(xié)作。該項目結(jié)構(gòu)有助于自動化圍繞版本控制、容器管理和處理機密信息的復(fù)雜任務(wù)，同時還支持跨團隊協(xié)作。

訪問加速計算資源。AI Workbench 部署是客戶端-服務(wù)器模型，用戶能夠開始在其工作站中的本地計算資源上進(jìn)行開發(fā)，并隨著訓(xùn)練作業(yè)的規(guī)模擴大而轉(zhuǎn)向數(shù)據(jù)中心或云資源。

Omniverse，構(gòu)建工業(yè)元宇宙

具體到工業(yè)領(lǐng)域，演講的另一位主角——Omniverse平臺，以及該平臺的基礎(chǔ)——開源通用場景描述框架OpenUSD，打開了工業(yè)元宇宙和數(shù)字孿生場景開發(fā)的想象力。

英偉達(dá)再推超級芯片，快過H100，打臉大摩“泡沫”論插圖3

圖源：SIGGRAPH大會

一句話介紹，Omniverse平臺是一個被用于跨3D工具的連接、描述和模擬，能加快構(gòu)建虛擬世界和工業(yè)數(shù)字化高級工作流程的軟件平臺。

新平臺的亮點包括更新開發(fā)原生OpenUSD應(yīng)用及擴展的引擎——Omniverse Kit，以及英偉達(dá)Omniverse Audio2Face基礎(chǔ)應(yīng)用和空間計算功能的更新。

Omniverse和模擬技術(shù)副總裁 Rev Lebaredian表示，更新后的Omniverse讓開發(fā)人員可以通過OpenUSD利用生成式AI強化他們的工具，并且讓工業(yè)企業(yè)能構(gòu)建更大、更復(fù)雜的世界級模擬，作為其工業(yè)應(yīng)用的數(shù)字測試場。

為了方便程序員使用，英偉達(dá)推出了一些Omniverse云API，其中包括基于NVIDIA Nemo框架的大語言模型ChatUSD、用于檢查兼容性和生成實時的完全路徑跟蹤的交互式USD文件渲染的RunUSD、語義搜索服務(wù)DeepSearch。

英偉達(dá)再推超級芯片，快過H100，打臉大摩“泡沫”論插圖4

黃仁勛宣布，比亞迪和梅賽德斯·奔馳合資的豪華電動汽車品牌騰勢（DENZA）已與營銷及通信巨頭WPP合作，在NVIDIA Omniverse Cloud上構(gòu)建和部署其下一代先進(jìn)汽車配置器。

除了上述介紹的這些新產(chǎn)品及更新，英偉達(dá)還推出了配備全新NVIDIA L40S GPU的NVIDIA OVX服務(wù)器，可用于加速AI訓(xùn)練和推理、3D設(shè)計和可視化、視頻處理和工業(yè)數(shù)字化等復(fù)雜的計算密集型應(yīng)用；

搭載RTX 6000 Ada GPU的全新NVIDIA RTX工作站，系統(tǒng)可配置NVIDIA AI Enterprise或Omniverse Enterprise軟件，以支持各種苛刻的生成式AI和圖形密集型工作負(fù)載；

企業(yè)軟件平臺NVIDIA AI enterprise 4.0，可提供生產(chǎn)就緒型生成式AI工具，并提供了可靠的生產(chǎn)部署所需的安全性和API穩(wěn)定性。

顯然，這位大模型時代的寵兒正在用硬實力證明，英偉達(dá)并不只是芯片生產(chǎn)商，而是不折不扣的模型開發(fā)平臺，而層出不窮的新產(chǎn)品和服務(wù)，則一次又一次地坐實了企業(yè)作為AI普惠核心推動者的身份。

日前，AMD發(fā)布了對標(biāo)H100的MI300X，在容量和帶寬上實現(xiàn)了反超，意圖在“缺芯”的背景下分食英偉達(dá)的市場，但隨著GH200發(fā)布，AMD的算盤是否還能在極致性價比的沖擊下起效？

一個現(xiàn)實是，在群狼環(huán)伺的AI戰(zhàn)場上，硬件、生態(tài)兩手抓的英偉達(dá)，目前還沒發(fā)現(xiàn)真正的對手。

參考資料：

英偉達(dá)超級芯片GH200 Grace明年Q2投產(chǎn)，黃仁勛稱“AI時代，英偉達(dá)的技術(shù)可以替代傳統(tǒng)數(shù)據(jù)中心”|王錚Silvia

老黃又來“搶錢”：英偉達(dá)再推超強芯片平臺，守住萬億芯片老大擂臺|硅星人

昨夜，黃仁勛甩出最強生成式AI處理器，全球首發(fā)HBM3e，比H100還快|智東西

NVIDIA Keynote at SIGGRAPH 2023

本文為專欄作者授權(quán)微新創(chuàng)想發(fā)表，版權(quán)歸原作者所有。文章系作者個人觀點，不代表微新創(chuàng)想立場，轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問，請聯(lián)系http://www.i0562.net/。

人人人免费人人专区人人,欧美精品不卡,欧美大片无尺码在线观看,久久精品小视频,成人免费黄色大片,欧美+亚洲+精品+三区

英偉達(dá)再推超級芯片，快過H100，打臉大摩“泡沫”論

超級芯片GH200，大小模型都能用

AI Workbench，讓人人都能做大模型

Omniverse，構(gòu)建工業(yè)元宇宙

您可能還喜歡...

發(fā)表回復(fù) 取消回復(fù)

熱門文章

熱門文章

人人人免费人人专区人人,欧美精品不卡,欧美大片无尺码在线观看,久久精品小视频,成人免费黄色大片,欧美+亚洲+精品+三区

英偉達(dá)再推超級芯片，快過H100，打臉大摩“泡沫”論

超級芯片GH200，大小模型都能用

AI Workbench，讓人人都能做大模型

Omniverse，構(gòu)建工業(yè)元宇宙

您可能還喜歡...

中國風(fēng)投30年，誰是下一個時代的大贏家？

陳建斌多巴胺穿搭上熱搜 網(wǎng)友：建議禁止AI換臉

加密貨幣億萬富翁資助的非營利組織投資 5 億美元購買英偉達(dá) AI 芯片

發(fā)表回復(fù) 取消回復(fù)

熱門文章

熱門文章

英偉達(dá)再推超級芯片，快過H100，打臉大摩“泡沫”論

AI Workbench，讓人人都能做大模型

Omniverse，構(gòu)建工業(yè)元宇宙

中國風(fēng)投30年，誰是下一個時代的大贏家？

陳建斌多巴胺穿搭上熱搜網(wǎng)友：建議禁止AI換臉