91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

ClawBench大模型榜單揭曉:智譜字節(jié)小米四款模型強勢闖入全球前十

   發(fā)布時間:2026-04-01 03:52 作者:蘇婉清

全球知名評測機構(gòu)ClawBench最新發(fā)布的大型模型榜單引發(fā)行業(yè)關(guān)注,北京三家人工智能企業(yè)的四款模型成功躋身全球前十,展現(xiàn)了中國AI技術(shù)的強勁實力。其中智譜科技研發(fā)的GLM-5-Turbo以93.9分的絕對優(yōu)勢登頂榜首,字節(jié)跳動旗下的豆包模型Doubao-Seed-2.0-lite緊隨其后位列第二,同時憑借最低的使用成本成為最具性價比的模型。

小米科技成為本次榜單的最大黑馬,其自主研發(fā)的MiMo-V2系列兩款模型同時入圍前十。MiMo-V2-Omni憑借卓越的運行速度斬獲第九名,而功能更強大的MiMo-V2-Pro在復(fù)雜邏輯推理、長指令遵循等核心維度表現(xiàn)突出,在Model Rank專業(yè)排名中位居全球第五。該機構(gòu)數(shù)據(jù)顯示,小米在實驗室綜合研發(fā)能力評估中同樣表現(xiàn)亮眼,在Text Arena(ArenaExpert)和Code Arena兩大權(quán)威榜單中分別位列全球第四和第五,綜合研發(fā)實力僅次于Anthropic、OpenAI和谷歌三家國際頂尖機構(gòu)。

ClawBench采用的評測機制具有顯著創(chuàng)新性,其關(guān)聯(lián)的Text Arena榜單通過雙盲測試模式,在完全隱藏模型身份的前提下,由全球真實用戶根據(jù)實際使用體驗進行投票評選。這種評測方式有效規(guī)避了傳統(tǒng)榜單中針對特定數(shù)據(jù)集進行優(yōu)化的"刷榜"行為,確保評測結(jié)果能夠真實反映模型在真實場景中的表現(xiàn),為行業(yè)提供了更具參考價值的評估標準。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群