智快網 - 新科技與新能源行業網絡媒體

ClawBench大模型榜單揭曉:智譜字節小米四款模型閃耀全球前十

   發布時間:2026-04-01 03:28 作者:趙云飛

近日,國際權威評測機構ClawBench公布了最新一期大型語言模型綜合排行榜,中國科技企業表現亮眼。北京智譜科技研發的GLM-5-Turbo以93.9分的絕對優勢登頂全球榜首,字節跳動旗下豆包模型Doubao-Seed-2.0-lite緊隨其后位居次席,小米公司更憑借MiMo-V2系列兩款模型實現雙榜突破,展現出中國AI研發團隊的強勁實力。

本次評測中,字節跳動的豆包模型不僅在性能指標上斬獲全球第二,更以顯著優勢成為全榜單中運行成本最低的模型。小米公司則實現多點開花,其MiMo-V2-Omni模型在運行效率專項測試中表現突出,位列全球第九;更值得關注的是,該系列高端版本MiMo-V2-Pro在復雜邏輯推理、長指令執行穩定性等核心指標上達到國際領先水平,在Model Rank專業評測中躋身全球前五。

在反映企業綜合研發能力的LabRank實驗室評測體系中,小米公司持續保持強勁勢頭。其Text Arena(ArenaExpert)文本生成能力評測位列全球第四,代碼生成專項Code Arena評測位居全球第五,整體技術實力已形成對Anthropic、OpenAI、谷歌等國際頂尖機構的追趕態勢。據評測機構介紹,Text Arena榜單采用全球首創的雙盲測試機制,通過隱藏模型身份信息、由真實用戶直接投票的方式,有效規避了傳統評測中常見的"數據集優化"問題,確保評測結果真實反映模型的實際應用表現。

行業觀察人士指出,本次評測結果標志著中國AI企業在基礎模型研發領域已實現從跟跑到并跑的跨越。特別是小米等硬件廠商的入局,正在推動大模型技術從實驗室走向真實應用場景,這種"軟硬協同"的發展模式或將重塑全球AI產業競爭格局。隨著ClawBench等第三方評測體系的不斷完善,技術實力的客觀比較將成為推動行業健康發展的重要力量。

 
 
更多>同類內容
全站最新
熱門內容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群