91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

阿里巴巴申請新專利:以思維鏈訓(xùn)練提升語言模型可解釋性與審核精度

   發(fā)布時間:2026-02-14 03:31 作者:柳晴雪

阿里巴巴(中國)有限公司近期在專利領(lǐng)域邁出重要一步,企查查APP最新信息顯示,該公司已正式申請公布一項名為“一種基于思維鏈訓(xùn)練大型語言模型的方法、裝置和設(shè)備”的專利技術(shù)。

據(jù)專利摘要介紹,這項創(chuàng)新技術(shù)通過構(gòu)建多維度數(shù)據(jù)體系優(yōu)化模型訓(xùn)練流程。研究團隊首先采集包含圖像、輔助文本說明及標(biāo)準(zhǔn)審核結(jié)果的大規(guī)模初始數(shù)據(jù)集,隨后運用這些數(shù)據(jù)生成結(jié)構(gòu)化的思維鏈數(shù)據(jù)集合。該數(shù)據(jù)集被用于對基礎(chǔ)語言模型進行全量參數(shù)微調(diào),形成具備初步處理能力的中間模型。

在迭代優(yōu)化階段,技術(shù)人員采用雙軌并進策略:一方面持續(xù)利用原始數(shù)據(jù)生成新的中間思維鏈數(shù)據(jù),另一方面通過預(yù)設(shè)的獎勵函數(shù)對生成數(shù)據(jù)進行質(zhì)量評估。特別值得關(guān)注的是,該專利創(chuàng)新性地引入組相對策略優(yōu)化算法(GRPO),通過強化學(xué)習(xí)機制對中間模型進行深度優(yōu)化,最終形成具備高解釋性和精準(zhǔn)審核能力的目標(biāo)語言模型。

這項技術(shù)的突破性在于構(gòu)建了數(shù)據(jù)生成-模型微調(diào)-強化學(xué)習(xí)的完整閉環(huán)。通過思維鏈數(shù)據(jù)的有序傳遞,既保證了模型訓(xùn)練過程的可追溯性,又顯著提升了復(fù)雜場景下的審核準(zhǔn)確率。專利文件特別強調(diào),該技術(shù)方案特別適用于需要高精度內(nèi)容審核的商業(yè)場景,能夠有效降低人工復(fù)核成本,提升系統(tǒng)整體運行效率。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群