游客發(fā)表
發(fā)帖時(shí)間:2024-12-29 11:11:03
11月14日消息,首次實(shí)測(cè)NVIDIA Blackwell GPU相當(dāng)強(qiáng)悍,跑分大家都知道,提升但到底有多強(qiáng)呢?多達(dá)
除了官方宣傳數(shù)據(jù),現(xiàn)在終于第一次看到了實(shí)測(cè)數(shù)據(jù),首次實(shí)測(cè)來自MLCommons MLPerf v4.1,跑分考察AI訓(xùn)練推理性能的提升最佳平臺(tái)。
對(duì)比對(duì)象是多達(dá)兩代服務(wù)器HGX B200、HGX H200,首次實(shí)測(cè)前者包含多達(dá)八顆Blackwell GPU B200,跑分單顆功耗高達(dá)1000W。提升
GPT-3預(yù)訓(xùn)練項(xiàng)目中,多達(dá)Blackwell的首次實(shí)測(cè)性能相比上代Hopper翻了一番。
Llama 2 700億參數(shù)微調(diào)項(xiàng)目中,跑分Blackwell的提升性能更是提升了多達(dá)2.2倍。
值得一提的是,Blackwell平臺(tái)具備ConnectX-7 SuperNICs網(wǎng)卡、Quantum-2 InfiniBand交換機(jī),再加上第五代NVLink互連總線,可以充分保障節(jié)點(diǎn)間的通信,可以平衡分配AI訓(xùn)練負(fù)載,整體效率更高。
比如同樣的GPT-3 1750億參數(shù)性能,Hopper需要多達(dá)256顆GPU,Blackwell就只需要64顆。
相關(guān)內(nèi)容
隨機(jī)閱讀
熱門排行
友情鏈接