91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

黃仁勛談AI芯片內(nèi)存之爭(zhēng):SRAM容量受限 難撼HBM核心地位

   發(fā)布時(shí)間:2026-01-10 05:01 作者:趙云飛

在近期舉辦的CES 2026展會(huì)上,英偉達(dá)首席執(zhí)行官黃仁勛就行業(yè)熱議的“是否能用低成本SRAM替代昂貴HBM”問(wèn)題給出了明確回應(yīng)。這一討論源于AI領(lǐng)域?qū)当驹鲂У钠惹行枨蟆S著SRAM加速器、GDDR推理方案及開(kāi)放權(quán)重模型的興起,部分從業(yè)者認(rèn)為這些技術(shù)可減少對(duì)英偉達(dá)高成本硬件的依賴(lài)。

SRAM(靜態(tài)隨機(jī)存取存儲(chǔ)器)憑借其基于觸發(fā)器的高速特性,在基準(zhǔn)測(cè)試中展現(xiàn)出無(wú)延遲的訪(fǎng)問(wèn)優(yōu)勢(shì),甚至被視為HBM(高帶寬內(nèi)存)的潛在替代者。黃仁勛承認(rèn),對(duì)于特定工作負(fù)載,SRAM的速度表現(xiàn)“令人驚嘆”,但其致命缺陷在于容量限制——當(dāng)前SRAM可容納的模型規(guī)模僅為HBM系統(tǒng)的百分之一。當(dāng)AI模型因上下文擴(kuò)展或功能增加而超出SRAM容量時(shí),系統(tǒng)必須調(diào)用外部?jī)?nèi)存,導(dǎo)致效率優(yōu)勢(shì)瞬間喪失。

他進(jìn)一步指出,現(xiàn)代AI模型的多樣性加劇了硬件適配的難度?;旌蠈?zhuān)家模型(MOE)、多模態(tài)任務(wù)、擴(kuò)散模型及自回歸模型等架構(gòu)對(duì)硬件的需求差異顯著:有的依賴(lài)顯存容量,有的依賴(lài)互連帶寬(如NVLink),且需求隨任務(wù)變化動(dòng)態(tài)調(diào)整。若硬件過(guò)度優(yōu)化某一特性(如純SRAM方案),一旦工作負(fù)載類(lèi)型改變,昂貴的芯片將因無(wú)法兼容而閑置,造成資源浪費(fèi)。

基于這一判斷,英偉達(dá)堅(jiān)持選擇HBM作為核心內(nèi)存方案。黃仁勛解釋?zhuān)诠蚕頂?shù)據(jù)中心場(chǎng)景中,硬件的靈活性直接決定經(jīng)濟(jì)效益。盡管HBM的物料成本更高,但其能適配算法和模型架構(gòu)的快速迭代,確保硬件在數(shù)周甚至數(shù)月的運(yùn)營(yíng)周期內(nèi)保持高利用率。相比之下,專(zhuān)用硬件雖能在5%-10%的任務(wù)中表現(xiàn)極致,卻無(wú)法覆蓋其余90%的通用需求,長(zhǎng)期來(lái)看反而增加成本。

針對(duì)“開(kāi)放模型是否會(huì)削弱英偉達(dá)技術(shù)壁壘”的質(zhì)疑,黃仁勛回應(yīng)稱(chēng),開(kāi)放并不等同于降低硬件要求。隨著開(kāi)放模型整合更長(zhǎng)上下文和更多模態(tài),其內(nèi)存占用同樣會(huì)呈指數(shù)級(jí)增長(zhǎng)。英偉達(dá)選擇承擔(dān)HBM的高成本與復(fù)雜系統(tǒng)設(shè)計(jì),正是為了保留“可選性”——既避免客戶(hù)被鎖定在狹窄的性能范圍,也保護(hù)自身硬件免受模型架構(gòu)快速迭代的沖擊。這一策略的核心在于平衡短期成本與長(zhǎng)期適應(yīng)性,以應(yīng)對(duì)AI技術(shù)演進(jìn)的不確定性。

 
 
更多>同類(lèi)內(nèi)容
全站最新
熱門(mén)內(nèi)容
 
智快科技微信賬號(hào)
微信群

微信掃一掃
加微信拉群
電動(dòng)汽車(chē)群
科技數(shù)碼群