智快網 - 新科技與新能源行業網絡媒體

許華哲攜「破殼機器人」入局家庭場景:以創新技術開啟通用機器人新篇章

   發布時間:2026-04-27 10:13 作者:沈如風

全球具身智能機器人領域正掀起一股新的創業浪潮,這一次,創業者的目光齊刷刷地投向了一個充滿挑戰與機遇的場景——家庭。近期,行業內一系列突破性進展為這一趨勢添了一把火,Scaling Law的苗頭初現,讓創業者們看到了家庭機器人從概念走向現實的曙光。

硅谷的具身智能公司Generalist AI在GEN-1模型上取得了令人矚目的成果。當他們為機器人輸入海量數據后,機器人在精細操作任務上的成功率從64%飆升至99%。這一數據驗證了通過大規模數據訓練提升機器人性能的可行性,為家庭機器人的發展提供了重要的技術支撐。與此同時,硅谷另一家當紅的具身智能獨角獸公司Sunday Robotics也在積極布局家庭場景。他們推出了Umi手套數據采集方案,并直接將機器人Memo送進家庭,承擔起收拾餐桌、沖咖啡、疊衣服等家務。這一創新舉措吸引了大量資本的關注和押注,進一步推動了家庭機器人領域的發展。

在中國,一位熟悉的面孔也加入了家庭機器人創業的行列,他就是許華哲。作為“伯克利歸國四子之一”和清華大學交叉信息研究院助理教授,許華哲在機器人領域有著深厚的學術背景和豐富的實踐經驗。2023年,他加入「星海圖」擔任首席科學家兼聯合創始人,助力該公司成為中國具身智能領域的明星企業。然而,在公司估值突破200億、融資近30億的巔峰時刻,許華哲卻選擇離開,創辦了全新的具身智能公司「破殼機器人」。他的目標很明確:打造能在家庭場景中工作的、真正具有泛化能力的具身智能機器人。

許華哲對家庭機器人的執著源于他年少時的夢想。初高中時期,他讀完《喬布斯傳》后,便立志要創辦一家偉大的To C公司。在清華、伯克利、斯坦福的求學過程中,他一直深耕機器人強化學習方向,夢想著將機器人送入千家萬戶。他理想中的家庭機器人,雖非無所不能,但能完成上一代機器人無法完成的復雜任務,如更精細的清潔工作和有條理地完成洗衣收納等長序列、多步驟任務。在他看來,這種創業方向的選擇不僅帶有強烈的審美追求,更蘊含著深遠的影響力。泛化性的本質是用最簡潔優雅的模型解決人類復雜的生活問題,將AI真正轉化為生產力。

從商業角度來看,切入To C家庭場景也是許華哲的理性選擇。他認為,當前大量機器人廠商將人形機器人送進工廠,完成傳統機械臂就能勝任的工作,本質上是在用新的人形做舊時代的事情,機器人未能發揮出真正的通用性。而家庭場景任務比工廠場景更混亂隨機,且數據豐富,是訓練通用模型的最佳土壤。真正的AGI應該在家庭場景中誕生和運用。

為了追趕時機,「破殼機器人」在創業短短一個月內就完成了融資、核心團隊組建、具身模型訓練和硬件迭代等多項工作。據悉,該公司近期完成了數千萬美元的天使輪融資,由云啟資本領投,順為資本、弘暉基金等一線美元基金,小米戰投、星海圖等知名產業方,以及BV百度風投、英諾天使基金、水木清華校友種子基金、東方嘉富等一線市場化基金紛紛支持??焖佾@得資本青睞,得益于許華哲在關鍵技術路線上的獨特選擇。

在關鍵技術路線方面,許華哲放棄了行業主流的VLA(視覺-語言-動作)基座模型方案,轉而構建一種能直接輸入和輸出“視頻-動作”的世界模型。在模型結構上,他提出了獨特的“UAG架構”,用并聯式預訓練替代過去的瀑布式級聯,并將強化學習貫穿預訓練與部署全過程,實現了訓練效率的五倍提升。在數據與硬件層面,他通過UMI、外骨骼和第一人稱視角三層方案采集高質量數據,形成從任務定義到數據、模型、本體的閉環迭代。據許華哲透露,「破殼機器人」第一代32B參數規模的具身世界模型已完成首輪訓練,正處于數據迭代的關鍵爬坡期。在硬件層面,為數據采集量身定制的手套硬件已迭代了五六個版本。

在接受采訪時,許華哲分享了他離開「星海圖」創立新公司的原因。他表示,內心一直渴望做一些To C的、真正泛化的通用機器人。雖然2023年加入星海圖時也考慮過直接創業,但當時剛從美國回來,在叉院工作才一年左右,要兼顧教職和創業挑戰很大。加入優秀團隊做聯創是更穩妥的選擇,且星海圖的宣傳理念與他的部分想法吻合。如今,新公司雖成立僅一個月,但已有20人左右的團隊,AI側有天才少年,硬件側有做過To C量產交付的工程師,目前還在火熱招聘中。在技術上,AI模型在“動得快”“泛化強”“成功率高”三個維度有較好積累,能讓機器人完成復雜任務時達到接近100%的成功率。

當被問及此次創業與第一次創業時心態的不同,許華哲表示,最大的不同是心態更踏實、更敢了。第一次創業前,他會擔心自己沒上過班、沒做過生意、沒跟投資人打過交道等問題。在星海圖的兩年,他接觸了這些事,發現太多的顧慮沒必要,出來混最重要是先出來,這次心理上更從容。

對于在2023年和2026年兩個節點創業做家庭機器人的區別,許華哲認為區別挺大。首先是硬件本體,這三年中國的硬件供應鏈打磨得更好了,有了更多能用的機器人,2023年時可能只能用工業臂;第二是數據,2023年時機器人的數據幾乎是0,現在網上開源數據就有幾十萬小時,還出現了大量的數據供應商,雖然數據質量和跨本體適配還是問題,但豐富度已不可同日而語;第三是融資和市場認知,2023年要做To C機器人可能很難融資,大家給的時間緩沖也更少,今天起步比2023年更好。

許華哲一直想做To C機器人,背后的觸發點主要有三點。首先,他認為機器人最核心的不同在于通用性,通用性應用在越混亂、越需要通用能力的地方,答案就是家庭或廣義的服務場景,通用的AGI應該用在家里。其次,從個人偏好來說,做有品牌的事情可以做得足夠大、有夢想,偉大的公司很多是To C的,比如蘋果、小米。最后,從數據角度看,通用性需要有豐富的數據,混亂的家庭場景恰恰能提供豐富的數據。

對于AI模型何時可以支撐做家庭To C機器人,許華哲預測比較樂觀激進,他認為兩年內會出現可以用起來的機器人。它不是萬能的,但會有完善的產品定義,能做相當多通用事情,不過會有一些明確不做的事,比如抱嬰兒、燒熱水。機器人進家庭能做的事情分為兩類,一類是本身很難的任務,如更精細的清潔;另一類是長序列、多步驟任務的串聯,如完整的洗衣流程。

家庭和工廠場景有著本質區別。工廠的混亂更多是“管理混亂”,具體干的活如上下料、裝配是高度確定性的;家里的混亂是任務本身的混亂,需要通過工作去恢復秩序。當前做家庭To C機器人最大的挑戰在于,機器人進家庭的邏輯和落地To B不同。To B的賬難算,工廠給人形機器人干的活價值低,且采集的數據可能過于?;o C的賬不是簡單的“替代人力”計算,它更像科技潮品+家庭助手+管家的復合體,用戶買它是購買一種先鋒的生活方式和極致的便利。關鍵是產品體驗要足夠好,價值感知要足夠強,價格區間內部還在討論,但肯定會是五位數起步。

許華哲判斷一件事情做與不做或是否感興趣的標準是美和影響力。美意味著創造出來的東西優雅、簡潔,泛化性的本質也是美;影響力意味著對世界產生足夠大的影響,改變人們的生活方式。他希望找到極致、坦誠、利他的合作伙伴,欣賞段永平的“本分文化”和Kimi“沒有部門墻”的協作模式,傾向于彈性、扁平的組織,贊同鼓勵一線員工直接向老板反饋問題的文化。

與其他從陪伴場景切入的To C機器人不同,「破殼機器人」追求的核心是物理世界的通用交互和干活能力,是“家庭助理”而非陪伴機器人。在技術上,他們的一大亮點是能用好強化學習。過去機器人對強化學習的使用一般停留在單機的后訓練上,而他們的強化學習可以用于價值函數評估數據質量,讓模型學得更精準,理解失敗的邊界,同時能在多個任務上保持高成功率高速度,不過度擬合到單一任務,還能突破人類數據上限,做出比人類示范數據更好的表現。他們的預訓練也會用離線的強化學習,目前模型路線還未收斂,選擇的是世界模型結合原生的機器人模型,而非VLA路線。

對于世界模型的理解,「破殼機器人」輸入的是視頻和動作,訓練和推理時輸出的也是視頻和動作,這些數據遵循物理規律。訓練大模型所需的Infra是挺大的卡點,要支撐32B的大模型和較大數據量,GPU集群的并行效率、數據吞吐都是挑戰和壁壘。他們的“UAG架構”采用并聯式預訓練,先對動作進行預訓練,再做整體聯合訓練,做動作預測器,然后與視覺模型聯合訓練,能最大程度保留基礎模型的泛化能力,大幅提升訓練效率。在數據方案上,主要分外骨骼數據采集、UMI方案和第一人稱視角人類數據三層,與其他家探索的不同之處在于會大量使用評估數據,包括機器人自己探索時的失敗和次優數據,且手套設計細節針對家庭任務精心打磨,構型設計追求通用性,8月末左右會展示與眾不同的數采系統。

當被問及現在出來創業是否太晚以及具身智能行業的融資環境,許華哲認為市場熱度還可以,投資人比較有熱情,且比之前更懂,會問得更細。在技術沒有收斂的今天,仍然有巨大的機會,后發者也有可能先至。

 
 
更多>同類內容
全站最新
熱門內容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群