站內搜索 | 手機版

智快網 - 新科技與新能源行業網絡媒體

當前位置：智快網 > 快訊 > 正文內容

文心5.1模型發布：成本大降性能提升，五大場景實測見真章

發布時間：2026-05-10 18:48 來源：天脈網作者：柳晴雪

百度近日宣布推出新一代基礎模型文心5.1，在模型壓縮和訓練成本優化方面取得突破性進展。該模型總參數量縮減至前代的三分之一，激活參數量壓縮約50%，預訓練成本僅為同規模業界模型的6%，同時保持了同級別模型中的領先性能。這一成果得益于百度自主研發的Once-for-All彈性訓練方法，通過動態采樣技術實現單次預訓練生成覆蓋多種參數規模的子模型矩陣。

在LMArena最新發布的文本生成大模型排行榜中，文心5.1以全球第14位的成績躋身前列。該模型在Agentic能力測試中展現出不俗表現，工具調用數學推理得分緊隨Gemini-3.1 Pro位列第二，多輪工具協作交互能力與Claude-Opus-4.6差距微小。不過在深度搜索Agent任務中，電子表格工具操作能力較頭部模型存在明顯差距，僅在基礎操作層面領先DeepSeek-V4-Pro。

知識推理與指令遵循能力測試顯示，文心5.1在高階學科知識推理（GPQA）和復雜指令遵循（AdvanceIF）兩個維度表現突出，僅次于Gemini-3.1 Pro。但在純數學推理（AIME26）和通用知識問答（MMLU-Pro）測試中，該模型在四款對比模型中排名末位，與頭部產品存在顯著性能差異。這種能力分布特點在創意寫作場景中同樣有所體現，雖然敘事風格和情感表達獲得認可，但故事框架創新性仍顯不足。

實際場景測試中，文心5.1展現出差異化的能力表現。在高考數學題解答場景，模型通過指示變量法和分布法給出完全正確的解答步驟；信息整合任務中，能自主拆解模糊需求生成結構化對比表格，并提供場景化使用建議。電子表格操作測試顯示，雖然基礎數據處理能力達標，但復雜表格生成仍需多次指令修正。編程能力測試暴露明顯短板，生成的3D格斗游戲代碼存在界面遮擋和交互失效問題，橫版跑酷游戲代碼則完全無法運行。

技術架構層面，文心5.1采用分離式模塊設計，將訓練、推理、獎勵計算和智能體循環四個核心環節獨立部署。通過FP8低精度算子庫優化和異構彈性調度技術，模型在保持訓練穩定性的同時，將CPU閑置算力利用率提升30%。后訓練流程創新采用"專家訓練-能力融合"雙軌機制，通過在線策略蒸餾技術實現代碼、推理等確定性能力的高效遷移，同時保留開放式任務的強化學習通道。

內部評測數據顯示，文心5.1的創意寫作能力已接近Gemini-3.1 Pro水平。該模型在國產大模型陣營中持續保持領先地位，其低成本訓練方案為行業提供了新的發展路徑。不過在工具調用深度和復雜辦公場景適應性方面，仍需通過后續迭代縮小與國際頭部模型的差距。

更多>同類內容

AI賦能EDA：從前端突破到全流程智能化的機遇與挑戰并存之路

05-10

北京現代艾尼氪V申報圖引熱議另類造型搭配高配內飾市場反響待考

05-10

從克制到加速：小紅書AI戰略大升級，如何重塑社區電商新生態？

05-10

川大春招現奇景：職業學院招人工智能博士，熱門工科博士緣何“不感冒”？

05-10

合資新能源“價格下探+本土深耕”雙管齊下，能否與中國品牌“平起平坐”？

05-09

2026危機公關新挑戰：“硬剛”“沉默”失效，AI技術成破局關鍵？

05-09

AI生成虛假信息致律師名譽受損，百度被判侵權：平臺責任不可“幻覺化”

05-09

華為Pura X Max折疊屏新機10天狂銷20萬，先發優勢與硬核配置成熱銷密碼

05-08

激光雷達加持智能領航，4納米芯片配星火大模型，長安啟源Q05重塑純電出行體驗

05-08

石頭科技5月7日股價微漲1.17% 主力資金凈流入超五千萬元引關注

05-08

胖東來模式難復制：2025年多家“學徒”企業虧損關店，轉型之路坎坷

05-08

胖東來19名管理人員降級1人免職，嚴苛管理下企業如何行穩致遠？

05-07

11萬家商場閉店：不是實體商業末路，而是創新轉型迎來新契機

05-07

6萬級家轎新標桿！全新榮威i6實測：大空間低油耗，家用務實不二之選

05-07

石頭科技攜三大系列智能割草機器人進軍荷蘭，與Vitaro共拓比荷盧市場

05-07

點擊查看更多 +

全站最新

百度股價飆升70%：“芯云模體”生態成型，AI長期布局開啟價值爆發期

百度股價飆升70%：“芯云模體”生態成型，AI長期布局開啟價值爆發期

曹操出行入局Robotaxi賽道，原生定制車Eva Cab能否開啟盈利新篇章？

曹操出行入局Robotaxi賽道，原生定制車Eva Cab能否開啟盈利新篇章？

大數據賦能轉型：招標采購導航網獲權威認可引領行業新發展

大數據賦能轉型：招標采購導航網獲權威認可引領行業新發展

工信部公示2025工業互聯網“鏈網協同”案例多家鋼企榮耀入選引關注

工信部公示2025工業互聯網“鏈網協同”案例多家鋼企榮耀入選引關注

萬象系統賦能首衡集配：售后處理提速六倍，成本降低服務升級

萬象系統賦能首衡集配：售后處理提速六倍，成本降低服務升級

AI賦能EDA：從前端突破到全流程智能化的機遇與挑戰并存之路

AI賦能EDA：從前端突破到全流程智能化的機遇與挑戰并存之路

尊界S800 Grand Design高定車型申報，余承東透露或為150萬至200萬級“科技藝術融合之作”

尊界S800 Grand Design高定車型申報，余承東透露或為150萬至200萬級“科技藝術融合之作”

AI生成虛假信息致律師名譽受損，平臺豈能以“技術幻覺”推卸責任？

AI生成虛假信息致律師名譽受損，平臺豈能以“技術幻覺”推卸責任？

熱門內容

智快實驗室評測約稿合作微信：netspread（注明:智快科技）簡體繁體根據客戶端智慧切換，如顯示有問題，請點擊頁面右上角的簡繁切換功能！
Copyright ? 2016-2021 zhikuai.com All rights reserved. 魯ICP備20033456號

微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群