91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

阿里千問Qwen3-Coder-Next發(fā)布:以低推理成本解鎖高效編程智能體新可能

   發(fā)布時(shí)間:2026-02-04 09:44 作者:江紫萱

阿里巴巴旗下千問團(tuán)隊(duì)近日正式發(fā)布全新語言模型Qwen3-Coder-Next,這款專為編碼代理和本地開發(fā)場(chǎng)景設(shè)計(jì)的開放權(quán)重模型,通過創(chuàng)新架構(gòu)與訓(xùn)練方法在編程智能體領(lǐng)域展現(xiàn)出顯著優(yōu)勢(shì)。該模型基于Qwen3-Next-80B-A3B-Base構(gòu)建,采用混合注意力機(jī)制與專家混合(MoE)架構(gòu),在保持低推理成本的同時(shí)實(shí)現(xiàn)了強(qiáng)大的編程能力。

在訓(xùn)練方法上,研究團(tuán)隊(duì)突破傳統(tǒng)參數(shù)擴(kuò)展模式,重點(diǎn)強(qiáng)化智能體訓(xùn)練信號(hào)的擴(kuò)展性。通過構(gòu)建包含大規(guī)??沈?yàn)證編程任務(wù)和可執(zhí)行環(huán)境的訓(xùn)練體系,模型能夠直接從環(huán)境反饋中學(xué)習(xí)優(yōu)化。具體訓(xùn)練流程涵蓋四個(gè)階段:首先在代碼與智能體相關(guān)數(shù)據(jù)上進(jìn)行持續(xù)預(yù)訓(xùn)練,隨后利用高質(zhì)量智能體軌跡數(shù)據(jù)進(jìn)行監(jiān)督微調(diào),接著針對(duì)軟件工程、QA測(cè)試、Web/UX設(shè)計(jì)等領(lǐng)域開展專家訓(xùn)練,最終將多領(lǐng)域?qū)<夷芰φ麴s整合到單一可部署模型中。這種訓(xùn)練范式特別強(qiáng)化了長程推理、工具調(diào)用和錯(cuò)誤恢復(fù)能力,這些特性對(duì)現(xiàn)實(shí)編程場(chǎng)景至關(guān)重要。

性能評(píng)估顯示,該模型在多個(gè)權(quán)威編程智能體基準(zhǔn)測(cè)試中表現(xiàn)突出。在SWE-Bench系列測(cè)試中,使用SWE-Agent框架時(shí)模型在Verified版本上取得超過70%的準(zhǔn)確率,在多語言版本和更具挑戰(zhàn)性的Pro版本中仍保持競(jìng)爭(zhēng)力。特別值得注意的是,盡管激活參數(shù)規(guī)模僅30億,其性能已可媲美激活參數(shù)多10-20倍的開源模型。在TerminalBench 2.0和Aider等基準(zhǔn)測(cè)試中,模型同樣展現(xiàn)出優(yōu)異表現(xiàn)。

效率分析圖表揭示,Qwen3-Coder-Next在性能與資源消耗間實(shí)現(xiàn)了更優(yōu)平衡。在SWE-Bench-Pro測(cè)試中,30億激活參數(shù)版本的性能與參數(shù)量大數(shù)十倍的模型相當(dāng),展現(xiàn)出顯著的成本優(yōu)勢(shì)。雖然全注意力架構(gòu)的專有模型在絕對(duì)性能上仍占優(yōu)勢(shì),但該模型在低成本智能體部署場(chǎng)景中已處于領(lǐng)先位置,特別適合資源受限環(huán)境下的編程任務(wù)處理。

技術(shù)文檔顯示,模型開發(fā)團(tuán)隊(duì)將持續(xù)優(yōu)化推理決策能力,計(jì)劃擴(kuò)展對(duì)更多編程任務(wù)類型的支持,并建立快速迭代機(jī)制根據(jù)用戶反饋持續(xù)改進(jìn)。目前該模型已通過ModelScope和Hugging Face平臺(tái)開源,開發(fā)者可自由獲取模型權(quán)重及訓(xùn)練代碼進(jìn)行二次開發(fā)。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
 
智快科技微信賬號(hào)
微信群

微信掃一掃
加微信拉群
電動(dòng)汽車群
科技數(shù)碼群