91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡媒體

小米MiMo-V2-Flash新模型發(fā)布:創(chuàng)新架構,性能超絕性價比拉滿

   發(fā)布時間:2025-12-18 00:04 作者:蘇婉清

小米近日正式推出全新開源大模型MiMo-V2-Flash,憑借3090億總參數(shù)與150億活躍參數(shù)的規(guī)模,采用專家混合架構(MoE)設計,在性能表現(xiàn)上與DeepSeek-V3.2、Kimi-K2等頭部開源模型形成有力競爭。該模型最引人注目的突破在于將推理速度提升至每秒150 tokens,同時將輸入成本壓縮至每百萬token僅0.1美元,輸出成本0.3美元,在性價比維度樹立了新標桿。

在基準測試中,MiMo-V2-Flash展現(xiàn)驚人實力:AIME 2025數(shù)學競賽與GPQA-Diamond科學知識測試均位列開源模型前兩名,編程能力尤為突出——在SWE-bench Verified真實軟件修復測試中取得73.4%的得分,超越所有開源競品,直逼GPT-5-High水平。多語言編程測試SWE-Bench Multilingual中,該模型以71.7%的解決率證明其跨語言開發(fā)能力。智能體任務測試顯示,其在通信類任務獲得95.3分,零售類79.5分,航空類66.0分,搜索代理任務在啟用上下文管理后得分從45.4躍升至58.3。

技術團隊通過兩項核心創(chuàng)新實現(xiàn)性能突破?;旌匣瑒哟翱谧⒁饬C制采用5層滑動窗口與1層全局注意力的激進配比,滑動窗口固定為128 token長度,使KV緩存存儲量減少近6倍,卻仍能支持256k超長上下文窗口。項目負責人羅福莉特別指出,實驗發(fā)現(xiàn)128窗口大小是性能與效率的最佳平衡點,盲目擴大窗口反而導致性能下降,同時強調(diào)實施該機制時sink values的必要性。另一項輕量級多Token預測(MTP)技術則打破傳統(tǒng)逐token生成模式,通過原生集成模塊實現(xiàn)并行預測,實測平均接受2.8-3.6個連續(xù)token,推理速度提升2-2.6倍,有效解決強化學習中長尾樣本導致的GPU空轉問題。

訓練階段采用FP8混合精度技術,在27萬億token數(shù)據(jù)上完成預訓練,原生支持32k序列長度。后訓練階段創(chuàng)新提出多教師在線策略蒸餾(MOPD),通過學生模型自主采樣、多專家教師實時反饋的方式,將訓練算力需求降至傳統(tǒng)方法的1/50。該架構支持動態(tài)接入新教師模型,形成"教學相長"的閉環(huán)進化系統(tǒng)。智能體強化學習擴展方面,研究團隊基于真實GitHub問題構建超10萬個驗證任務,在Kubernetes集群部署并發(fā)超萬個Pod,環(huán)境部署成功率達70%,并開發(fā)多模態(tài)驗證器通過視頻錄制確保代碼執(zhí)行準確性。

對于開發(fā)者群體,MiMo-V2-Flash提供256k上下文窗口支持數(shù)百輪智能體交互,可無縫集成Claude Code、Cursor等主流開發(fā)環(huán)境。模型權重已在Hugging Face平臺以MIT協(xié)議開源,包含完整技術報告與推理代碼。目前該模型已通過API Platform限時免費開放,所有優(yōu)化經(jīng)驗同步分享至LMSYS博客,相關代碼貢獻給SGLang社區(qū)。這種全鏈條開源策略在國內(nèi)科技企業(yè)中實屬罕見,為行業(yè)技術演進提供了重要參考。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群