英偉達(dá)再推超級芯片,快過H100,打臉大摩“泡沫”論
編者按:本文來自微信公眾號 硅基研究室(ID:gh_cef05ac13977),作者:白嘉嘉,微新創(chuàng)想經(jīng)授權(quán)轉(zhuǎn)載
摩根士丹利分析師剛給英偉達(dá)貼上“泡沫”的標(biāo)簽,英偉達(dá)就拿出了最新一代GH 200 Grace Hopper超級芯片平臺,證明這股AI熱并非搖搖欲墜的空中樓閣。
美東時間8月8日,在洛杉磯的SIGGRAPH大會上,英偉達(dá)發(fā)布新一代GH200 Grace Hopper超級芯片平臺,該平臺依托于搭載全球首款HBM3e處理器的Grace Hopper超級芯片(后稱GH200)。
圖源:SIGGRAPH大會
英偉達(dá)表示,新平臺旨在處理世界上最復(fù)雜的生成式AI工作負(fù)載,涵蓋大型語言模型、推薦系統(tǒng)和矢量數(shù)據(jù)庫,將提供多種配置。
除了超級芯片平臺,英偉達(dá)還發(fā)布了5款硬件新品和簡化企業(yè)級AI開發(fā)過程的AI workbench服務(wù)等內(nèi)容。
其中,5款硬件新品分別是搭載全新L40S Ada GPU的新款OVX服務(wù)器、搭載RTX 6000 Ada GPU的全新RTX工作站,以及3款高端桌面工作站GPU。
超級芯片GH200,大小模型都能用
本次發(fā)布會上,黃仁勛照舊搬出了那句標(biāo)志性的促銷口號,“買得越多,省得越多”。
同樣花1億美金,過去能買8800塊x86 CPU組成的數(shù)據(jù)中心,功耗是5MV。
在GH200面世后,這1億美金發(fā)揮出了更大的價值。通過購買2500塊GH200組成的Ios-Budget數(shù)據(jù)中心,不僅可以將功耗降低到3MV,AI推理性能更是達(dá)到了前者的12倍,折合能效提升20倍。
同等推理性能的情況下,Iso-Troughput數(shù)據(jù)中心只需用到210塊GH200,功耗是0.26MW,成本只有x86 CPU數(shù)據(jù)中心的二分之一,僅800萬美元。
圖源:SIGGRAPH大會
即便和英偉達(dá)的拳頭產(chǎn)品——在eBay上漲到4.5萬美元的H100相比,GH200的表現(xiàn)同樣讓人驚艷。
基于全球最快內(nèi)存HBM3e,GH 200內(nèi)存容量高達(dá)141GB,提供每秒5TB的帶寬。每個GPU容量達(dá)到H100的1.7倍,帶寬達(dá)1.55倍。
對于行業(yè)來說,更大的容量和更高的運行速度,意味著未來可以讓模型駐留在單個GPU上,而不必需要多個系統(tǒng)或GPU才能運行。
但這并不意味著GH 200就不適用于生成式AI的巨型模型,英偉達(dá)新發(fā)布的NVIDIA NVLink?服務(wù)器設(shè)計,對GH200進(jìn)行了拓展。
NVIDIA NVLink?將允許Grace Hopper超級芯片可以與其他超級芯片連接組合,這一技術(shù)方案為GPU提供了完全訪問CPU內(nèi)存的途徑。
同時,英偉達(dá)表示,目前正在開發(fā)一款新的雙GH200基礎(chǔ)NVIDIA MGX服務(wù)器系統(tǒng),將集成兩個下一代Grace Hopper超級芯片。
在新的雙GH200服務(wù)器中,系統(tǒng)內(nèi)的CPU和GPU將通過完全一致的內(nèi)存互連進(jìn)行連接,這個超級GPU可以作為一個整體運行,提供144個Grace CPU核心、8千萬億次的計算性能以及282GB的HBM3e內(nèi)存。
AI Workbench,讓人人都能做大模型
除了全新的超級芯片平臺,另一項對行業(yè)起到促進(jìn)作用的內(nèi)容是AI Workbench。
英偉達(dá)認(rèn)為,當(dāng)前企業(yè)級AI的開發(fā)過程太過繁瑣和復(fù)雜,不僅需要在多個庫中尋找合適的框架和工具,當(dāng)項目需要從一個基礎(chǔ)設(shè)施遷移到另一個基礎(chǔ)設(shè)施時,過程可能會變得更加具有挑戰(zhàn)性。
簡單來說,AI Workbench實現(xiàn)了企業(yè)級模型的快速打包和搬運,讓開發(fā)者既可以在個人電腦、筆記本電腦或工作站上快速創(chuàng)建、測試和定制生成式AI模型,也可以在必要時重新將其拓展到數(shù)據(jù)中心、公有云或NVIDIA DGX Cloud。
具體到使用上,AI Workbench提供了一個簡單的用戶界面,開發(fā)人員能夠?qū)⒛P?、框架、SDK等信息從開源資源整合到統(tǒng)一的工作區(qū)中,可以在本地計算機上運行并連接到HuggingFace、Github以及其它流行開源或商用AI代碼儲存庫。
圖源:SIGGRAPH大會
英偉達(dá)表示,使用 AI Workbench 的一些主要優(yōu)勢包括:
易于使用的開發(fā)平臺。AI Workbench 通過提供單一平臺來管理數(shù)據(jù)、模型和計算資源,支持跨機器和環(huán)境的協(xié)作,從而簡化了開發(fā)流程。
與 AI 開發(fā)工具和存儲庫集成。AI Workbench 與 GitHub、NVIDIA NGC 和 Hugging Face 等服務(wù)和 Git 服務(wù)器集成,用戶可以使用 JupyterLab 和 VS Code 等工具跨平臺和基礎(chǔ)設(shè)施進(jìn)行開發(fā),具有高度的可重復(fù)性和透明度。
增強協(xié)作。該項目結(jié)構(gòu)有助于自動化圍繞版本控制、容器管理和處理機密信息的復(fù)雜任務(wù),同時還支持跨團隊協(xié)作。
訪問加速計算資源。AI Workbench 部署是客戶端-服務(wù)器模型,用戶能夠開始在其工作站中的本地計算資源上進(jìn)行開發(fā),并隨著訓(xùn)練作業(yè)的規(guī)模擴大而轉(zhuǎn)向數(shù)據(jù)中心或云資源。
Omniverse,構(gòu)建工業(yè)元宇宙
具體到工業(yè)領(lǐng)域,演講的另一位主角——Omniverse平臺,以及該平臺的基礎(chǔ)——開源通用場景描述框架OpenUSD,打開了工業(yè)元宇宙和數(shù)字孿生場景開發(fā)的想象力。
圖源:SIGGRAPH大會
一句話介紹,Omniverse平臺是一個被用于跨3D工具的連接、描述和模擬,能加快構(gòu)建虛擬世界和工業(yè)數(shù)字化高級工作流程的軟件平臺。
新平臺的亮點包括更新開發(fā)原生OpenUSD應(yīng)用及擴展的引擎——Omniverse Kit,以及英偉達(dá)Omniverse Audio2Face基礎(chǔ)應(yīng)用和空間計算功能的更新。
Omniverse和模擬技術(shù)副總裁 Rev Lebaredian表示,更新后的Omniverse讓開發(fā)人員可以通過OpenUSD利用生成式AI強化他們的工具,并且讓工業(yè)企業(yè)能構(gòu)建更大、更復(fù)雜的世界級模擬,作為其工業(yè)應(yīng)用的數(shù)字測試場。
為了方便程序員使用,英偉達(dá)推出了一些Omniverse云API,其中包括基于NVIDIA Nemo框架的大語言模型ChatUSD、用于檢查兼容性和生成實時的完全路徑跟蹤的交互式USD文件渲染的RunUSD、語義搜索服務(wù)DeepSearch。
黃仁勛宣布,比亞迪和梅賽德斯·奔馳合資的豪華電動汽車品牌騰勢(DENZA)已與營銷及通信巨頭WPP合作,在NVIDIA Omniverse Cloud上構(gòu)建和部署其下一代先進(jìn)汽車配置器。
除了上述介紹的這些新產(chǎn)品及更新,英偉達(dá)還推出了配備全新NVIDIA L40S GPU的NVIDIA OVX服務(wù)器,可用于加速AI訓(xùn)練和推理、3D設(shè)計和可視化、視頻處理和工業(yè)數(shù)字化等復(fù)雜的計算密集型應(yīng)用;
搭載RTX 6000 Ada GPU的全新NVIDIA RTX工作站,系統(tǒng)可配置NVIDIA AI Enterprise或Omniverse Enterprise軟件,以支持各種苛刻的生成式AI和圖形密集型工作負(fù)載;
企業(yè)軟件平臺NVIDIA AI enterprise 4.0,可提供生產(chǎn)就緒型生成式AI工具,并提供了可靠的生產(chǎn)部署所需的安全性和API穩(wěn)定性。
顯然,這位大模型時代的寵兒正在用硬實力證明,英偉達(dá)并不只是芯片生產(chǎn)商,而是不折不扣的模型開發(fā)平臺,而層出不窮的新產(chǎn)品和服務(wù),則一次又一次地坐實了企業(yè)作為AI普惠核心推動者的身份。
日前,AMD發(fā)布了對標(biāo)H100的MI300X,在容量和帶寬上實現(xiàn)了反超,意圖在“缺芯”的背景下分食英偉達(dá)的市場,但隨著GH200發(fā)布,AMD的算盤是否還能在極致性價比的沖擊下起效?
一個現(xiàn)實是,在群狼環(huán)伺的AI戰(zhàn)場上,硬件、生態(tài)兩手抓的英偉達(dá),目前還沒發(fā)現(xiàn)真正的對手。
參考資料:
英偉達(dá)超級芯片GH200 Grace明年Q2投產(chǎn),黃仁勛稱“AI時代,英偉達(dá)的技術(shù)可以替代傳統(tǒng)數(shù)據(jù)中心”|王錚Silvia
老黃又來“搶錢”:英偉達(dá)再推超強芯片平臺,守住萬億芯片老大擂臺|硅星人
昨夜,黃仁勛甩出最強生成式AI處理器,全球首發(fā)HBM3e,比H100還快|智東西
NVIDIA Keynote at SIGGRAPH 2023
本文為專欄作者授權(quán)微新創(chuàng)想發(fā)表,版權(quán)歸原作者所有。文章系作者個人觀點,不代表微新創(chuàng)想立場,轉(zhuǎn)載請聯(lián)系原作者。如有任何疑問,請聯(lián)系http://www.i0562.net/。