英偉達 顯卡驅動
IT之家 1 月 7 日消息,NVIDIA 今天發布了適用于 GNU / Linux、FreeBSD 和 Solaris 系統的 NVIDIA 525.78.01 顯卡驅動程序,以解決先前版本中的一些...
2025.07.03COPYRIGHT ? 2023
粵ICP備2021108052號
郵箱:611661226@qq.com
留言給我編輯:Aeneas 潤
最新MLPerf訓練基準測試中,H100 GPU在所有的八項測試中都創下了新紀錄!
如今,NVIDIA H100幾乎已經統治了所有類別,并且是新LLM基準測試中使用的唯一 的GPU。
3,584個H100 GPU群在短短11分鐘內完成了基于GPT-3的大規模基準測試。
MLPerf LLM基準測試是基于OpenAI的GPT-3模型進行的,包含1750億個參數。
Lambda Labs估計,訓練這樣一個大模型需要大約3.14E23 FLOPS的計算量。
11分鐘訓出GPT-3的怪獸是如何構成的
在LLM和BERT自然語言處理 (NLP) 基準測試中排名最高的系統,是由NVIDIA和Inflection AI聯合開發。
由專門從事企業級GPU加速工作負載的云服務提供商CoreWeave托管。
該系統結合了3584個NVIDIA H100加速器和896個Intel Xeon Platinum 8462Y+處理器。
因為英偉達在H100中引入了新的Transformer引擎,專門用于加速Transformer模型訓練和推理,將訓練速度提高了6倍。
CoreWeave從云端提供的性能與英偉達從本地數據中心運行的AI超級計算機所能提供的性能已經非常接近了。
這得益于CoreWeave使用的NVIDIA Quantum-2 InfiniBand網絡具有低延遲網絡。
隨著參與訓練的H100 GPU從數百個擴展到3000多個。
良好的優化使得整個技術堆棧在要求嚴苛的LLM測試中實現了近乎線性的性能擴展。
如果將GPU的數量降低到一半,訓練相同的模型時間會增加到24分鐘。
說明整個系統的效率潛力,隨著GPU的增加,是超線性的。
最主要的原因是,英偉達從GPU設計之初就考慮到了這個問題,使用NVLink技術來高效實現了GPU之間的通信。
在參與測試的90個系統中,有82個系統都使用了英偉達的GPU進行加速。
單卡訓練效率
系統集群訓練時間對比
英特爾參加測評的系統使用64到96個不等的Intel Xeon Platinum 8380 處理器和256到389個不等的Intel Habana Gaudi2加速器。
然而,英特爾提交的GPT-3的訓練時間為311分鐘。
成績和英偉達相比就稍微有點慘不忍睹了。
分析師:英偉達優勢過大
行業分析師認為,英偉達的在GPU上的技術優勢是非常明顯的。
而它作為AI基礎設施提供商,在行業中的主導地位還體現在英偉達多年建立起來的生態系統粘性上。
AI社區對英偉達的軟件的依賴性也非常強。
幾乎所有AI框架都基于英偉達提供的底層CUDA庫和工具。
而且它還能提供全堆棧的AI工具和解決方案。
除了為AI開發人員提供支持之外,英偉達還繼續投資用于管理工作負載和模型的企業級工具。
在可預見的未來,英偉達在行業的領先地位將會非常穩固。
分析師還進一步指出。
MLPerf測試結果中所展現的,NVIDIA系統在云端進行AI訓練的強大功能和效率,才是英偉達「戰未來」的最大本錢。
下一代Ada Lovelace GPU,2025年發布
Tom's Hardware自由撰稿人Zhiye Liu也于近日發文,介紹了下一代英偉達Ada Lovelace顯卡的計劃。
H100訓練大模型的能力,毋庸置疑。
只用3584個H100,短短11分鐘內,就能訓練出一個GPT-3模型。
在最近的新聞發布會上,英偉達分享了一份新路線圖,詳細介紹了下一代產品,包括GeForce RTX 40系列Ada Lovelace GPU的繼任者,而前者,是當今最好的游戲顯卡。
根據路線圖,英偉達計劃在2025年推出「Ada Lovelace-Next」顯卡。
如果繼續沿用當前的命名方案,下一代GeForce產品應該是作為GeForce RTX 50系列上市。
根據南美黑客組織LAPSU$得到的信息,Hopper Next很可能被命名為Blackwell。
在消費級顯卡上,英偉達保持著兩年一更新的節奏。
他們在2016年推出了Pascal,在2018年推出了Turing,在2020年推出了Ampere,在2022年推出了Ada Lovelace。
如果這次Ada Lovelace的繼任者會在2025年推出,英偉達無疑就打破了通常的節奏。
最近的AI大爆發,產生了對英偉達GPU的巨大需求,無論是最新的H100,還是上一代的A100。
根據報道,某大廠今年就訂購了價值10億美元的Nvidia GPU。
盡管有出口限制,但我國仍然是英偉達在全世界最大的市場之一。
(據說,在深圳華強北電子市場,就可以買到少量英偉達A100,每塊售價為2萬美元,是通常價格的兩倍。)
對此,英偉達已經對某些AI產品做了微調,發布了H100或A800等特定SKU,以滿足出口要求。
Zhiye Liu對此分析道,換個角度看,出口法規其實是有利于英偉達的,因為這意味著芯片制造商客戶必須購買更多原版GPU的變體,才能獲得同等的性能。
這也就能理解,為什么英偉達會優先考慮生成計算GPU,而非游戲GPU了。
最近的報道顯示,英偉達已經增加了計算級GPU的產量。
沒有面臨來自AMD的RDNA 3產品堆棧的激烈競爭,英特爾也沒有對GPU雙頭壟斷構成嚴重威脅,因此,英偉達在消費側可以拖延。
最近,Nvidia通過GeForce RTX 4060和GeForce RTX 4060 Ti,將其GeForce RTX 40系列產品堆棧又擴大了。
GeForce RTX 4050以及頂部的RTX 4080 Ti或GeForce RTX 4090 Ti等,都有潛力。
如果迫不得已,英偉達還可以從舊的Turing版本中拿出一個產品,更新Ada Lovelace,給它封個「Super」待遇,進一步擴展Ada陣容。
最后,Zhiye Liu表示,至少今年或明年,Lovelace架構不會真正更新。
參考資料:
https://blogs.nvidia.com/blog/2023/06/27/generative-ai-debut-mlperf/
IT之家 1 月 7 日消息,NVIDIA 今天發布了適用于 GNU / Linux、FreeBSD 和 Solaris 系統的 NVIDIA 525.78.01 顯卡驅動程序,以解決先前版本中的一些...
2025.07.03小伙伴問想玩英雄聯盟用什么顯卡最好?是實話關于這個游戲我真的是太佩服他了,在好的顯卡在它面前基本上看不出太大優勢反而以前的老顯卡到還是流暢的不要不要的尤其是一代神卡750ti,可以說屬于英雄聯盟御用顯...
2025.07.02前段時間,英偉達發布了最新的RTX 40系顯卡,發布會上所帶來的性能提升相當喜人,當然價格也相當喜人,國行7199元起步的RTX 4080 12G版本,著實讓不少人的錢包一緊。然而,當你想看看RTX ...
2025.07.03IT之家 3 月 31 日消息,英偉達于今天發布了 474.30 驅動更新,為采用開普勒(Kepler)架構的英偉達 GeForce GTX 600 系列、GTX 700 系列、GTX TITAN、T...
2025.07.03IT之家 10 月 27 日消息,今天,英偉達發布了 Game Ready 526.47 WHQL 驅動,支持新款 RTX 3060/3060 Ti 顯卡。英偉達表示,為了給游戲玩家和創作者提供更多選...
2025.07.03