91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

華為數(shù)據(jù)存儲(chǔ)攜手中科弘云 推出AI推理加速方案 賦能多行業(yè)應(yīng)用

   發(fā)布時(shí)間:2025-12-23 19:47 作者:朱天宇

華為數(shù)據(jù)存儲(chǔ)與中科弘云近日聯(lián)合推出了一項(xiàng)AI推理加速解決方案,旨在通過(guò)軟硬件深度協(xié)同優(yōu)化,為長(zhǎng)序列推理場(chǎng)景提供高效算力支撐。該方案以華為OceanStor A系列存儲(chǔ)為核心數(shù)據(jù)底座,結(jié)合中科弘云自主研發(fā)的HyperCN智算互聯(lián)網(wǎng)云服務(wù)平臺(tái),構(gòu)建起覆蓋數(shù)據(jù)存儲(chǔ)、算力調(diào)度、推理加速的全棧能力體系。

在技術(shù)架構(gòu)層面,方案創(chuàng)新性地融合了華為UCM推理記憶數(shù)據(jù)管理技術(shù)與中科弘云平臺(tái)能力。通過(guò)KV Cache多級(jí)緩存管理機(jī)制,將推理過(guò)程中的關(guān)鍵數(shù)據(jù)持久化存儲(chǔ)于OceanStor A系列設(shè)備,實(shí)現(xiàn)推理記憶的全量保存與快速調(diào)用。這種設(shè)計(jì)有效減少了重復(fù)計(jì)算開銷,配合Prefix Cache與GSA稀疏加速算法,在長(zhǎng)序列推理場(chǎng)景中可顯著降低首Token生成時(shí)延(TTFT)。實(shí)測(cè)數(shù)據(jù)顯示,在智能問(wèn)答典型場(chǎng)景中,該方案使TTFT降低57.5%,且序列長(zhǎng)度與優(yōu)化效果呈正相關(guān)關(guān)系。

針對(duì)復(fù)雜算力環(huán)境,方案構(gòu)建了異構(gòu)資源管理體系。系統(tǒng)支持英偉達(dá)、華為昇騰、寒武紀(jì)等多品牌AI芯片的協(xié)同調(diào)度,兼容MindSpore、vLLM、SGLang等主流開發(fā)框架,并通過(guò)Kubernetes容器編排技術(shù)實(shí)現(xiàn)與存儲(chǔ)系統(tǒng)的無(wú)縫對(duì)接。這種設(shè)計(jì)使得能源電力、智能制造等行業(yè)的用戶能夠靈活整合現(xiàn)有算力資源,避免硬件鎖定帶來(lái)的技術(shù)風(fēng)險(xiǎn)。

在算力調(diào)度方面,方案采用細(xì)粒度資源池化策略,可根據(jù)業(yè)務(wù)需求動(dòng)態(tài)分配計(jì)算資源。系統(tǒng)具備集群作業(yè)調(diào)度、實(shí)時(shí)健康監(jiān)測(cè)、故障自動(dòng)恢復(fù)等運(yùn)維能力,支持分鐘級(jí)任務(wù)重啟與系統(tǒng)自愈。特別是在長(zhǎng)文檔處理場(chǎng)景中,結(jié)合GSA稀疏加速算法后,當(dāng)序列長(zhǎng)度達(dá)到39K時(shí),系統(tǒng)并發(fā)處理能力提升86%,整體推理吞吐量增長(zhǎng)36%,有效提升了復(fù)雜模型的生產(chǎn)部署效率。

為降低AI開發(fā)門檻,方案提供覆蓋全流程的端到端工具鏈,涵蓋數(shù)據(jù)標(biāo)注、模型訓(xùn)練、推理部署等關(guān)鍵環(huán)節(jié)。工具鏈同時(shí)支持傳統(tǒng)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)開發(fā)模式,實(shí)現(xiàn)AI資產(chǎn)的標(biāo)準(zhǔn)化管理。目前該方案已在國(guó)家實(shí)驗(yàn)室、能源電力、智能制造等領(lǐng)域啟動(dòng)試點(diǎn)應(yīng)用,通過(guò)實(shí)際場(chǎng)景驗(yàn)證了其在復(fù)雜業(yè)務(wù)環(huán)境中的技術(shù)可行性。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
 
智快科技微信賬號(hào)
微信群

微信掃一掃
加微信拉群
電動(dòng)汽車群
科技數(shù)碼群