近期,AI領(lǐng)域迎來了一項(xiàng)重大突破,月之暗面團(tuán)隊(duì)正式推出了其最新研發(fā)的開源代碼大模型——Kimi-Dev-72B。這款模型在軟件工程基準(zhǔn)測(cè)試SWE-bench Verified中取得了令人矚目的成績(jī),以60.4%的準(zhǔn)確率刷新了全球開源模型的最高紀(jì)錄。
據(jù)了解,Kimi-Dev-72B是專為軟件工程任務(wù)量身打造的,盡管其參數(shù)量?jī)H為720億,但在SWE-bench Verified測(cè)試中,卻成功超越了近期發(fā)布的DeepSeek-R1-0528模型。后者雖然擁有高達(dá)6710億的參數(shù)量,但在此次測(cè)試中僅以57.6%的準(zhǔn)確率落后于Kimi-Dev-72B。

Kimi-Dev-72B之所以能夠在測(cè)試中脫穎而出,得益于其采用的大規(guī)模強(qiáng)化學(xué)習(xí)訓(xùn)練方法。該模型能夠在真實(shí)的代碼環(huán)境中自動(dòng)修復(fù)Docker存儲(chǔ)庫,并且只有在完整測(cè)試套件通過后才給予獎(jiǎng)勵(lì)。這種訓(xùn)練方式極大地提升了模型輸出的正確性和魯棒性,使其更加貼合實(shí)際的軟件開發(fā)標(biāo)準(zhǔn)。
Kimi-Dev-72B的模型權(quán)重和源代碼已經(jīng)全面開源,并在Hugging Face與GitHub平臺(tái)上向開發(fā)者社區(qū)開放下載和部署。這一舉措無疑將極大地推動(dòng)軟件工程領(lǐng)域的發(fā)展,為開發(fā)者們提供更加高效、智能的工具。























