在具身智能技術(shù)加速向工廠、家庭和醫(yī)療場景滲透的背景下,數(shù)據(jù)供給不足已成為制約行業(yè)規(guī)模化落地的核心難題。京東集團近日宣布推出覆蓋全鏈路的數(shù)據(jù)基礎(chǔ)設(shè)施解決方案,通過構(gòu)建全球最大規(guī)模的具身數(shù)據(jù)采集體系,為行業(yè)提供從數(shù)據(jù)生成到模型優(yōu)化的閉環(huán)支撐。據(jù)技術(shù)團隊披露,該計劃將發(fā)動60萬人參與數(shù)據(jù)采集,目標(biāo)在兩年內(nèi)積累1000萬小時真實場景視頻數(shù)據(jù),重點解決機器人訓(xùn)練數(shù)據(jù)匱乏的痛點。
京東云自主研發(fā)的可穿戴式超高清采集設(shè)備JoyEgoCam成為數(shù)據(jù)采集環(huán)節(jié)的關(guān)鍵突破。這款設(shè)備通過優(yōu)化光學(xué)模組與傳輸協(xié)議,在物流分揀、手術(shù)操作、家庭服務(wù)等動態(tài)場景中實現(xiàn)4K級視頻的穩(wěn)定采集。技術(shù)負(fù)責(zé)人介紹,設(shè)備內(nèi)置的AI校準(zhǔn)系統(tǒng)可自動修正運動模糊,確保每個動作片段的時空連續(xù)性,為后續(xù)數(shù)據(jù)標(biāo)注提供可靠基礎(chǔ)。
在數(shù)據(jù)處理層面,京東構(gòu)建的AI數(shù)據(jù)湖平臺展現(xiàn)出強大的吞吐能力。該平臺采用分布式計算架構(gòu),可每秒處理數(shù)萬幀視頻數(shù)據(jù),通過自動化的清洗、對齊和預(yù)標(biāo)注流程,將原始數(shù)據(jù)的利用率提升80%。更值得關(guān)注的是JoyBuilder仿真平臺,其通過物理引擎重構(gòu)真實場景,能將1小時人類操作數(shù)據(jù)擴展為10小時仿真訓(xùn)練素材,有效緩解真實數(shù)據(jù)采集成本高昂的難題。
行業(yè)調(diào)研顯示,當(dāng)前具身智能模型訓(xùn)練面臨嚴(yán)重的數(shù)據(jù)鴻溝。京東技術(shù)委員會主席曹鵬指出,要訓(xùn)練出具備跨場景適應(yīng)能力的通用模型,至少需要千萬小時級的真實交互數(shù)據(jù),而現(xiàn)有公開數(shù)據(jù)集規(guī)模不足需求的百分之一。"許多機器人演示時能跳舞翻跟頭,但進入生產(chǎn)線連零件都抓不穩(wěn),這就是數(shù)據(jù)泛化能力缺失的典型表現(xiàn)。"他以工業(yè)機械臂為例,說明現(xiàn)有數(shù)據(jù)集在設(shè)備型號、操作流程、環(huán)境參數(shù)等方面存在嚴(yán)重碎片化問題。
京東的數(shù)據(jù)戰(zhàn)略展現(xiàn)出獨特的生態(tài)優(yōu)勢。依托覆蓋3600個智能倉庫、1.2萬家零售門店和20萬醫(yī)藥終端的服務(wù)網(wǎng)絡(luò),其數(shù)據(jù)采集場景天然具備多模態(tài)特征。從自動化分揀線的機械臂操作,到藥房抓藥機器人的精準(zhǔn)動作,再到家政機器人的復(fù)雜環(huán)境交互,這些真實業(yè)務(wù)場景產(chǎn)生的結(jié)構(gòu)化數(shù)據(jù),為模型訓(xùn)練提供了豐富的負(fù)樣本和邊緣案例。





















