智快網 - 新科技與新能源行業網絡媒體

22歲天才復現Claude Mythos架構并開源 融合創新思路引領AI新方向

   發布時間:2026-04-20 18:52 作者:唐云澤

一場由22歲創業者引發的技術風暴正在席卷AI界。Kye Gomez,這位年僅22歲的初創公司CEO,憑借對公開論文的深度解析和第一性原理推導,成功復現了Anthropic閉源一年的核心架構Claude Mythos,并將其完整開源為OpenMythos項目。這一突破性成果不僅讓行業震驚,更可能重塑大模型發展的技術路徑。

與傳統堆砌參數的Transformer架構不同,OpenMythos的核心創新在于"循環深度Transformer"(RDT)設計。該架構通過單一計算模塊的16次循環迭代實現推理深化,每次循環都會更新隱藏狀態并注入原始輸入,形成類似"思維循環"的推理機制。這種設計使模型在保持770M參數規模時,就能達到1.3B參數標準模型的性能水平,參數效率實現質的飛躍。

項目架構采用獨特的三段式設計:首尾的Prelude和Coda層使用標準Transformer結構,中間循環核心則融合了多專家混合(MoE)機制。每個前饋網絡層被替換為動態路由專家系統,隨著隱藏狀態演化自動選擇不同專家組合,既保證計算廣度又維持推理深度。特別引入的多潛變量注意力機制,通過壓縮KV緩存實現10-20倍顯存節省,使消費級硬件運行大模型成為可能。

為確保循環穩定性,開發團隊設計了三重保障機制:通過譜半徑約束控制迭代過程,采用自適應計算時間實現逐位置停機,并引入深度級LoRA適配器使每次迭代具備獨立調整能力。這些創新使模型在數學推理、代碼生成等復雜任務中展現出顯著優勢,Parcae團隊的實驗數據顯示其性能已達到同規模標準模型的兩倍。

該項目的開源代碼已在GitHub公開,包含完整訓練流程和推理實現。開發者僅需數行代碼即可部署模型,這種技術民主化趨勢正動搖傳統閉源實驗室的競爭優勢。行業觀察者指出,當核心架構可通過公開信息重建時,真正的技術壁壘將轉向數據質量、工程優化和生態建設。

這位顛覆行業的年輕人履歷同樣引人注目。Kye Gomez高中畢業后即投身創業,先后創立Swarms、Agora Labs等公司,構建起覆蓋AI深科技、媒體和食品科技的多領域生態。其研究聚焦大規模多智能體系統和替代模型架構,這次突破正是其技術理念的集中體現。隨著OpenMythos的發布,AI領域正迎來新的競爭維度——從參數規模競爭轉向思維深度競爭。

 
 
更多>同類內容
全站最新
熱門內容
 
智快科技微信賬號
微信群

微信掃一掃
加微信拉群
電動汽車群
科技數碼群