91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

小米發(fā)布MoE大模型MiMo-V2-Flash,性能媲美頂尖模型,多項實測表現(xiàn)亮眼

   發(fā)布時間:2025-12-18 00:05 作者:柳晴雪

小米今日正式發(fā)布并開源了最新一代MoE架構(gòu)大模型MiMo-V2-Flash,該模型總參數(shù)規(guī)模達3090億,激活參數(shù)150億,在推理、編碼及智能體應(yīng)用場景中展現(xiàn)出顯著優(yōu)勢。模型支持混合思維模式,用戶可自由切換深度思考與即時響應(yīng)模式,并具備一鍵生成完整HTML網(wǎng)頁的能力,可與Claude Code、Cursor等主流編碼框架無縫協(xié)作。

在性能測試中,MiMo-V2-Flash與DeepSeek-V3.2形成直接競爭態(tài)勢?;鶞蕯?shù)據(jù)顯示,該模型在數(shù)學(xué)競賽AIME 2025和科學(xué)知識GPQA-Diamond測試中位列開源模型前二,軟件工程能力SWE驗證及多語言測試中更超越所有開源競品,性能表現(xiàn)與全球頂尖閉源模型持平。特別在長上下文處理方面,其性能已超越K2 Thinking模型,在SWE-Bench Verified測試中解決率達71.7%,BrowseComp搜索評估得分45.4,配合上下文管理后提升至58.3。

技術(shù)架構(gòu)層面,模型采用全局注意力(GA)與滑動窗口注意力(SWA)的1:5混合結(jié)構(gòu),既保持了線性注意力的計算效率,又顯著提升了長文本處理能力。創(chuàng)新引入的多詞元預(yù)測(MTP)訓(xùn)練技術(shù),通過同步生成多個候選token并并行驗證的方式,使解碼吞吐量提升2-2.6倍。后訓(xùn)練階段采用的多教師在線策略蒸餾(MOPD)方法,僅需傳統(tǒng)方法1/50的計算資源即可達成同等優(yōu)化效果,形成"教學(xué)-學(xué)習(xí)"閉環(huán)迭代機制。

實際場景測試驗證了模型的多樣化能力:在網(wǎng)頁開發(fā)任務(wù)中,可生成包含商品輪播、規(guī)格選擇等功能的電商頁面,以及支持手勢交互的3D圣誕樹應(yīng)用;在創(chuàng)意生成方面,能創(chuàng)作憂郁愛情故事和非虛構(gòu)社會觀察作品;智能體交互測試中,既可解答"是否服用長生不老藥"等哲學(xué)問題,也能編寫科幻懸疑劇本。不過實測發(fā)現(xiàn),部分復(fù)雜交互場景(如教育類太陽系探索器)仍存在穩(wěn)定性問題,需多次生成才能達到預(yù)期效果。

該模型已實現(xiàn)全面開源,推理代碼完整貢獻至開發(fā)者社區(qū)SGLang,API服務(wù)開啟限時免費體驗。技術(shù)文檔顯示,在Prefill單機吞吐50000 toks/s條件下,16K上下文長度的解碼吞吐量達5000-15000 toks/s,單請求吞吐量151-115 toks/s。價格策略方面,輸入token單價0.7元/百萬,輸出token單價2.1元/百萬,顯著低于行業(yè)平均水平。

此次發(fā)布標志著小米大模型研發(fā)進入快車道。集團近期宣布將AI與現(xiàn)實世界深度結(jié)合列為未來十年核心戰(zhàn)略,AI業(yè)務(wù)投入連續(xù)四個季度環(huán)比增長超50%。為加速技術(shù)突破,小米同步啟動全球人才招募計劃,設(shè)立千萬元級崗位薪酬,重點引進大模型領(lǐng)域頂尖人才。技術(shù)團隊近三個月已密集發(fā)布多篇學(xué)術(shù)論文,并陸續(xù)開源多個預(yù)訓(xùn)練模型,構(gòu)建起完整的技術(shù)生態(tài)體系。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群