91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

阿里發(fā)布Qwen3-Max-Thinking:性能比肩國(guó)際頂尖,推理能力創(chuàng)新高

   發(fā)布時(shí)間:2026-01-27 09:38 作者:楊凌霄

阿里近日正式推出其最新一代千問旗艦推理模型——Qwen3-Max-Thinking,該模型在多項(xiàng)權(quán)威評(píng)測(cè)中創(chuàng)下全球新紀(jì)錄,性能比肩國(guó)際頂尖的GPT-5.2和Gemini 3 Pro,成為國(guó)內(nèi)AI大模型領(lǐng)域的新標(biāo)桿。

作為阿里目前規(guī)模最大、能力最強(qiáng)的推理模型,Qwen3-Max-Thinking的總參數(shù)量超過萬億級(jí)別,預(yù)訓(xùn)練數(shù)據(jù)量高達(dá)36T Tokens。通過大規(guī)模擴(kuò)展總參數(shù)、強(qiáng)化學(xué)習(xí)以及推理計(jì)算,新模型在科學(xué)知識(shí)、數(shù)學(xué)推理、代碼編程等關(guān)鍵性能基準(zhǔn)測(cè)試中刷新了全球紀(jì)錄,展現(xiàn)了強(qiáng)大的技術(shù)實(shí)力。

在推理能力提升方面,Qwen3-Max-Thinking引入了一種創(chuàng)新的測(cè)試時(shí)擴(kuò)展(Test-time Scaling)機(jī)制。這一機(jī)制通過提煉此前推理的“經(jīng)驗(yàn)”,并進(jìn)行多輪自我迭代,在相同上下文中實(shí)現(xiàn)更高效的推理計(jì)算,從而獲得更智能的結(jié)果。相比業(yè)界普遍采用的冗余推理方式,該機(jī)制顯著提升了推理效率和性能。例如,在“人類最后的測(cè)試”(HLE)中,Qwen3-Max-Thinking以58.3分的成績(jī)超越了GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分,成為當(dāng)前所有模型中的最高分。

針對(duì)即將到來的智能體Agent時(shí)代,Qwen3-Max-Thinking還大幅增強(qiáng)了自主調(diào)用工具的原生Agent能力。通過基于規(guī)則獎(jiǎng)勵(lì)與模型獎(jiǎng)勵(lì)的聯(lián)合強(qiáng)化學(xué)習(xí)訓(xùn)練,模型能夠更智能地結(jié)合工具進(jìn)行思考。這種自適應(yīng)的工具調(diào)用能力已在QwenChat上實(shí)現(xiàn),用戶可以體驗(yàn)到模型自主選用搜索、個(gè)性化記憶和代碼解釋器等核心Agent工具功能,獲得更專業(yè)、更貼合需求的回答,同時(shí)模型幻覺問題也顯著減少,為解決復(fù)雜任務(wù)奠定了基礎(chǔ)。

目前,開發(fā)者可以在QwenChat上免費(fèi)體驗(yàn)Qwen3-Max-Thinking模型,企業(yè)用戶則可通過阿里云百煉獲取新模型的API服務(wù)。普通用戶也可以通過千問的PC端和網(wǎng)頁端試用該模型。據(jù)悉,千問App即將接入這一新模型,屆時(shí)所有用戶均可免費(fèi)體驗(yàn)這款國(guó)內(nèi)最強(qiáng)的AI大模型。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
 
智快科技微信賬號(hào)
微信群

微信掃一掃
加微信拉群
電動(dòng)汽車群
科技數(shù)碼群