91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

Mano-P 1.0全球領(lǐng)先!13個(gè)榜單登頂,GUI智能體開啟個(gè)性化AI新紀(jì)元

   發(fā)布時(shí)間:2026-04-14 04:52 作者:趙云飛

當(dāng)人們還在討論AI能否在虛擬世界中完成復(fù)雜任務(wù)時(shí),一款名為Mano-P 1.0的智能體模型已經(jīng)突破了圖形界面的操作邊界,甚至能代替人類完成打麻將這樣的娛樂活動(dòng)。這款由明略科技自主研發(fā)的通用GUI智能體模型,不僅在13個(gè)多模態(tài)基準(zhǔn)測試中登頂全球榜首,更通過本地化部署和純視覺交互方案,重新定義了AI與物理世界的交互方式。

在權(quán)威測試平臺(tái)OSWorld上,Mano-P 1.0以58.2%的任務(wù)成功率領(lǐng)先第二名13.2個(gè)百分點(diǎn),成為首個(gè)超越專用模型性能的720億參數(shù)級(jí)智能體。更令人矚目的是,該模型在WebRetriever Protocol I測試中以41.7分超越Gemini 2.5 Pro和Claude 4.5等千億級(jí)通用大模型,展現(xiàn)出專用模型在特定領(lǐng)域的獨(dú)特優(yōu)勢。這些成績的取得,源于其獨(dú)創(chuàng)的Text?Action雙向自增強(qiáng)學(xué)習(xí)框架,通過自然語言與操作動(dòng)作的循環(huán)一致性訓(xùn)練,使模型同時(shí)具備界面理解和自主決策能力。

與傳統(tǒng)依賴云端API的方案不同,Mano-P 1.0采用純本地化運(yùn)行架構(gòu),所有推理過程均在設(shè)備端完成。在搭載M4芯片的Mac設(shè)備上,其40億參數(shù)的量化模型可實(shí)現(xiàn)每秒476個(gè)token的預(yù)填充速度,峰值內(nèi)存占用僅4.3GB。這種設(shè)計(jì)不僅解決了數(shù)據(jù)隱私泄露風(fēng)險(xiǎn),更使模型在無網(wǎng)絡(luò)環(huán)境下仍能保持完整功能。測試數(shù)據(jù)顯示,在涉及網(wǎng)頁操作和專業(yè)剪輯軟件的混合工作流中,該模型能自主完成從視頻生成到二次評(píng)測的全流程自動(dòng)化任務(wù)。

開源策略的差異化實(shí)施是Mano-P項(xiàng)目的另一大亮點(diǎn)。項(xiàng)目團(tuán)隊(duì)采用三階段漸進(jìn)式開源方案:首先開放具備開箱即用特性的CLI工具和Agent插件,使開發(fā)者能快速構(gòu)建自動(dòng)化工作流;隨后開源本地化模型和SDK組件,滿足高安全性場景的部署需求;最終公開訓(xùn)練方法論,包括視覺Token剪枝技術(shù)和強(qiáng)化學(xué)習(xí)框架等核心專利。這種分層開放策略既保護(hù)了技術(shù)創(chuàng)新成果,又為不同層次的開發(fā)者提供了靈活的選擇空間。

在技術(shù)實(shí)現(xiàn)層面,Mano-P通過三項(xiàng)關(guān)鍵突破解決了端側(cè)部署難題。其獨(dú)創(chuàng)的GSPruning視覺剪枝技術(shù),通過保留全局空間錨點(diǎn)的方式將視覺Token保留率壓縮至12.57%,在維持任務(wù)成功率的同時(shí)使吞吐量提升2-3倍。雙向強(qiáng)化學(xué)習(xí)框架則突破傳統(tǒng)單向訓(xùn)練模式,使模型能同時(shí)理解自然語言指令和界面元素語義。這些創(chuàng)新使得模型在有限算力下仍能保持高效推理能力,為個(gè)性化AI的落地提供了技術(shù)保障。

項(xiàng)目首席科學(xué)家趙晨旭將Mano-P的"P"定義為Personalized(個(gè)性化)的縮寫,這揭示了模型研發(fā)的核心愿景。區(qū)別于追求通用能力的AGI路線,該模型更注重將個(gè)體經(jīng)驗(yàn)轉(zhuǎn)化為決策參數(shù)。以麻將場景為例,通用AI會(huì)選擇理論最優(yōu)解,而個(gè)性化AI則能模擬用戶特有的記牌習(xí)慣和杠牌策略。這種設(shè)計(jì)理念在軟件測試領(lǐng)域已展現(xiàn)出應(yīng)用潛力,模型可參照PRD文檔自動(dòng)完成端到端GUI測試,形成"開發(fā)-測試-修復(fù)"的完整閉環(huán)。

隨著720億參數(shù)完整模型和40億參數(shù)端側(cè)模型的同步開源,開發(fā)者已能構(gòu)建覆蓋研究驗(yàn)證到生產(chǎn)落地的完整技術(shù)棧。在Apache 2.0協(xié)議框架下,項(xiàng)目提供的三種接入形態(tài)——命令行工具、Agent插件和Python SDK,分別滿足了快速體驗(yàn)、深度集成和自主調(diào)度的不同需求。這種開放生態(tài)的建設(shè),正在推動(dòng)GUI自動(dòng)化領(lǐng)域從瀏覽器協(xié)議依賴向跨平臺(tái)通用方案的轉(zhuǎn)型。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
 
智快科技微信賬號(hào)
微信群

微信掃一掃
加微信拉群
電動(dòng)汽車群
科技數(shù)碼群