91精品国产成人久久-777米奇色狠狠俺去啦-91亚洲欧美强伦三区-成年午夜av在线免费观看-欧美性视频欧美欧一欧美-午夜剧场在线观看高清-国产自拍视频在线观看网址-亚洲日韩精品无码专区97-麻豆国产成人免费视频

智快網(wǎng) - 新科技與新能源行業(yè)網(wǎng)絡(luò)媒體

從清華少年到OpenAI骨干:翁家翌如何用“鏟子”撬動AI未來?

   發(fā)布時間:2026-01-21 05:31 作者:蘇婉清

在人工智能領(lǐng)域,OpenAI一直是備受矚目的創(chuàng)新引擎,而其核心團(tuán)隊中有一位來自中國的工程師——翁家翌,近日在AI播客WhynotTV Podcast中分享了他從清華學(xué)子成長為OpenAI基礎(chǔ)設(shè)施骨干的非凡經(jīng)歷,引發(fā)了廣泛關(guān)注。

翁家翌在強(qiáng)化學(xué)習(xí)與后訓(xùn)練(Post-Training)系統(tǒng)開發(fā)中扮演著關(guān)鍵角色,深度參與了GPT-3.5、GPT-4、GPT-5等里程碑式模型的訓(xùn)練工作。他構(gòu)建的基礎(chǔ)設(shè)施系統(tǒng)不僅成為OpenAI內(nèi)部大模型訓(xùn)練與迭代的核心支撐,更是ChatGPT持續(xù)進(jìn)化的重要基石。在長達(dá)兩個多小時的深度對話中,他首次公開了OpenAI內(nèi)部Post-Training系統(tǒng)的構(gòu)建邏輯,并剖析了公司持續(xù)產(chǎn)出爆款模型的成功要素。

從清華大學(xué)到OpenAI,翁家翌的職業(yè)軌跡充滿傳奇色彩。在清華求學(xué)期間,他就展現(xiàn)出與眾不同的思維模式——將所有作業(yè)開源共享,打破信息壁壘,這一舉動在校園內(nèi)引發(fā)轟動。他坦言:"在清華,信息差常被視為生存資源,但我認(rèn)為每個人都應(yīng)平等獲取知識。"這種理念貫穿了他的整個職業(yè)生涯。

大學(xué)時期,翁家翌的科研方向幾經(jīng)轉(zhuǎn)折。從圖形學(xué)到網(wǎng)絡(luò)安全,再到最終專注的強(qiáng)化學(xué)習(xí),他始終保持著對技術(shù)本質(zhì)的探索熱情。大二時,他與學(xué)長發(fā)現(xiàn)并修復(fù)了清華校園網(wǎng)的漏洞,使原本需要付費的成績單下載服務(wù)變?yōu)槊赓M,這一經(jīng)歷不僅鍛煉了他的實戰(zhàn)能力,更堅定了他用技術(shù)解決實際問題的信念。

在強(qiáng)化學(xué)習(xí)領(lǐng)域,翁家翌的探索之路并非一帆風(fēng)順。他回憶道,早期在一個上世紀(jì)90年代的游戲中訓(xùn)練神經(jīng)網(wǎng)絡(luò)時,常常需要"瘋狂地用技巧防止訓(xùn)練崩掉",這種"煉丹"般的體驗讓他意識到工具層面的重要性。大四時,他決定轉(zhuǎn)向基礎(chǔ)設(shè)施開發(fā),這一戰(zhàn)略選擇為他日后在OpenAI的工作奠定了基礎(chǔ)。

2020年,面對多家科技巨頭的橄欖枝,翁家翌最終選擇了當(dāng)時尚未廣為人知的OpenAI。"我想體驗世界最前沿的research是怎么做的",這個決定源于他對強(qiáng)化學(xué)習(xí)和系統(tǒng)能力的深刻認(rèn)知。加入初期,他就參與了WebGPT后續(xù)項目,構(gòu)建的RL訓(xùn)練系統(tǒng)在ChatGPT上線前已成為公司主力基礎(chǔ)設(shè)施之一。

在OpenAI,翁家翌主導(dǎo)搭建了強(qiáng)化學(xué)習(xí)后訓(xùn)練階段的核心基礎(chǔ)設(shè)施,他的工作哲學(xué)是"把infra地基打好,讓別人去玩"。他將自己定位為"賣鏟子里最面向客戶的那位",因為強(qiáng)化學(xué)習(xí)模塊處于基礎(chǔ)設(shè)施棧的最頂端。這種定位使他能夠直接影響模型訓(xùn)練的效率和效果。

對于OpenAI持續(xù)推出爆款模型的現(xiàn)象,翁家翌歸因于兩個關(guān)鍵因素:高效率的迭代機(jī)制和技術(shù)領(lǐng)導(dǎo)層的深度參與。他透露,公司引入前Google工程負(fù)責(zé)人后,團(tuán)隊開始系統(tǒng)性提升工程效率,"RL本質(zhì)上就是試錯,試得越快越多,成功就越近"。而領(lǐng)導(dǎo)層對技術(shù)細(xì)節(jié)的強(qiáng)關(guān)注,確保了組織上下信息通暢,避免了"身子動了,腳沒動"的執(zhí)行困境。

在ChatGPT 3.5發(fā)布前,翁家翌就已在GPT-4上驗證了RLHF流程的可行性。他回憶道,當(dāng)時需要從頭構(gòu)建許多關(guān)鍵流程,最大的挑戰(zhàn)在于模型效果的衡量標(biāo)準(zhǔn)不清晰。"你訓(xùn)練出很多個checkpoint,但不知道哪個更好",最終團(tuán)隊只能依賴"人機(jī)協(xié)同"的評估流程,通過內(nèi)部員工交互測試來選出最佳版本。

面對外界對OpenAI"不開放"的批評,翁家翌有著深刻理解。他認(rèn)為開源與商業(yè)可持續(xù)之間存在必然取舍:"你沒法直接把最好的模型開源,因為公司要生存。"在他看來,OpenAI的"Open"戰(zhàn)略體現(xiàn)在降低使用門檻上,比如提供免費版本和語音模式體驗,這比直接開源模型權(quán)重更有實際意義。

對于AGI(通用人工智能)的定義,翁家翌認(rèn)為不存在統(tǒng)一標(biāo)準(zhǔn):"OpenAI內(nèi)部15個人可能有20種定義方法。"他個人傾向于任務(wù)完成度的量化標(biāo)準(zhǔn):"如果它能完成80%、90%我認(rèn)為有意義的任務(wù),那可能就是AGI了。"不過,他坦言當(dāng)前模型尚無法完全接管他負(fù)責(zé)的代碼修改工作,因為AI infra的數(shù)據(jù)集覆蓋度仍然不足。

在組織管理層面,翁家翌觀察到大型科技公司的共同挑戰(zhàn)——規(guī)模帶來的效率衰減。他提到DeepSeek的快速迭代曾引發(fā)OpenAI內(nèi)部警覺,這也是公司決定重構(gòu)Infra的原因:"Infra的迭代是OpenAI的生死線,我們早就不做為了刷榜而做的事了。"

展望未來,翁家翌提出了一個大膽設(shè)想:具有無限上下文記憶能力的AI Agent可能成為最合適的CEO。他認(rèn)為,當(dāng)前組織臃腫、信息共享不一致的問題源于人類認(rèn)知的局限性,而AI可以突破這些限制,未來或許能承擔(dān)起決策者的核心角色。

當(dāng)被問及如果擁有預(yù)測未來的能力會如何時,這位技術(shù)理想主義者表現(xiàn)出罕見的謹(jǐn)慎:"這會導(dǎo)致所有價值體系的崩塌。"他選擇專注于當(dāng)下,"假裝不知道世界是否確定",這種哲學(xué)思考折射出他對技術(shù)倫理的深刻反思。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數(shù)碼群