91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡媒體

蘋果Ferret-UI Lite端側AI模型:3B參數(shù)精準駕馭復雜UI界面

   發(fā)布時間:2026-02-21 08:16 作者:顧雨柔

蘋果研究團隊近日在學術領域公布了一項重要成果——專為移動設備設計的多模態(tài)大語言模型Ferret-UI Lite正式亮相。這款僅含30億參數(shù)的輕量級模型,在性能測試中展現(xiàn)出驚人實力,甚至超越了參數(shù)量達其24倍的大型服務器端模型,為移動端AI應用開辟了全新路徑。

傳統(tǒng)通用大模型在處理移動端UI界面時,常因屏幕尺寸限制難以精準識別微小圖標與文本。針對這一痛點,研究團隊創(chuàng)新性地引入"推理時裁剪"技術:模型首先對屏幕內容進行整體分析,隨后智能定位關鍵區(qū)域并放大處理,如同人類調整焦距觀察細節(jié)。這種策略使模型無需處理完整圖像數(shù)據(jù),即可高效捕捉界面核心元素,顯著提升識別準確率。

在數(shù)據(jù)訓練環(huán)節(jié),研究團隊構建了獨特的合成數(shù)據(jù)生成系統(tǒng)。該系統(tǒng)通過模擬真實操作環(huán)境,設置"任務生成-規(guī)劃執(zhí)行-錯誤修正"的閉環(huán)流程,讓AI在虛擬場景中反復試錯。這種訓練方式不僅生成了海量多樣化樣本,更使模型具備應對突發(fā)狀況的能力,例如處理無響應點擊或彈窗干擾等現(xiàn)實問題。實驗表明,通過這種方式訓練的模型,其魯棒性明顯優(yōu)于依賴人工標注數(shù)據(jù)的傳統(tǒng)方法。

性能測試顯示,該模型在執(zhí)行單步基礎操作時表現(xiàn)卓越,例如快速定位應用入口或識別按鈕功能。但在處理需要多步驟協(xié)同的復雜任務時,如自動完成表單填寫或跨應用數(shù)據(jù)遷移,仍存在優(yōu)化空間。研究團隊透露,后續(xù)將通過改進任務分解算法和強化長序列記憶能力來提升復雜任務處理水平。

這款模型最突出的優(yōu)勢在于完全本地化運行能力。用戶設備無需上傳屏幕截圖至云端服務器,即可實現(xiàn)應用自動操作功能。這種設計不僅大幅降低響應延遲,更從技術架構層面杜絕了數(shù)據(jù)泄露風險,為金融、醫(yī)療等對隱私要求極高的領域提供了可行解決方案。目前研究團隊已開放部分技術細節(jié),供開發(fā)者探索更多移動端AI應用場景。

 
 
更多>同類內容
全站最新
熱門內容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群