在人工智能算力需求急劇增長的背景下,一個顯著的技術(shù)挑戰(zhàn)正擺在業(yè)界面前:傳統(tǒng)芯片發(fā)展路徑逼近物理極限,而AI所需的計算能力卻在持續(xù)飆升。這一矛盾促使業(yè)界探索新的解決方案,超節(jié)點技術(shù)應運而生,它通過高帶寬互連將多張加速卡整合為統(tǒng)一的超級計算單元,突破了傳統(tǒng)架構(gòu)的擴展瓶頸。
然而,在國內(nèi),高端算力的稀缺使得國產(chǎn)超節(jié)點方案面臨更大挑戰(zhàn)。為了整合更大規(guī)模的集群,對互連技術(shù)的要求也更為苛刻。此時,光學方案以其帶寬、能耗和傳輸距離上的優(yōu)勢,成為了推動超節(jié)點性能提升的關(guān)鍵。近日,曦智科技在世界人工智能大會上發(fā)布了國內(nèi)首個光互連光交換GPU超節(jié)點方案——光躍LightSphere X,并與壁仞科技、中興通訊聯(lián)合示范應用,即將在上海儀電國產(chǎn)超節(jié)點算力集群落地。

光躍LightSphere X的核心在于其全球首創(chuàng)的分布式光交換技術(shù)。這一技術(shù)通過硅光子技術(shù)實現(xiàn)的分布式光交換芯片(dOCS),摒棄了傳統(tǒng)的集中式交換模式,使得每張計算卡都能通過更短、更直接的路徑進行通信。這一創(chuàng)新不僅提升了超節(jié)點的靈活性,還顯著降低了冗余成本,實現(xiàn)了“卡級冗余”,相較于傳統(tǒng)“節(jié)點級冗余”,冗余率大幅降低。
曦智科技創(chuàng)始人兼CEO沈亦晨博士表示,分布式光交換技術(shù)使得光躍LightSphere X能夠靈活配置超節(jié)點規(guī)模,并適應不同模型負載對通信模式的差異化需求。在大規(guī)模訓練和推理場景中,這一解決方案展現(xiàn)出了明顯的優(yōu)勢。dOCS芯片基于硅光技術(shù),不依賴于先進半導體工藝節(jié)點,這對于提升算力基礎(chǔ)設施供應鏈的安全性與韌性具有重要意義。
光躍LightSphere X還推動了國產(chǎn)算力生態(tài)的發(fā)展。當前,國產(chǎn)GPU類型多樣、協(xié)議各異,難以形成協(xié)同效應。而光交換技術(shù)不依賴于特定的數(shù)據(jù)傳輸協(xié)議,能夠無縫兼容不同廠商的互連協(xié)議,有效緩解了開放生態(tài)中缺乏高效Scale-Up交換芯片的現(xiàn)狀。

曦智科技在光電混合算力領(lǐng)域的長期投入,使得光躍LightSphere X得以問世。自成立以來,曦智科技在光子矩陣計算、片上光網(wǎng)絡和片間光網(wǎng)絡等領(lǐng)域取得了核心技術(shù)突破,并打造了光子計算和光子網(wǎng)絡兩大產(chǎn)品線。沈亦晨博士認為,硅光技術(shù)正迎來歷史機遇期,未來五年,硅光芯片在智算中心的占比有望提升至30%以上。隨著規(guī)模化量產(chǎn),硅光芯片成本將成倍下降,推動成本降低到應用普及的正向循環(huán)。
曦智科技的高管們一致認為,隨著算力集群和算力需求的持續(xù)增長,硅光技術(shù)將成為必然的解決方案。光互連和光交換技術(shù)當前仍屬于系統(tǒng)級方案,但未來有望與主芯片實現(xiàn)共封裝,進一步提高帶寬和能效。曦智科技已擁有一支近250人的團隊,并在光學芯片、模擬芯片、先進封裝技術(shù)等方面擁有前瞻性的技術(shù)儲備。
盡管光電混合算力技術(shù)在落地過程中面臨客戶原有技術(shù)路徑的慣性挑戰(zhàn),但曦智科技已在光躍LightSphere X方案上實現(xiàn)了從0到千卡的突破,這將極大地推動光互連超節(jié)點方案的魯棒性和成本效益驗證。曦智科技以光電混合算力技術(shù)為支點,正逐步撬動算力基礎(chǔ)設施的升級,保持對“光替代電”的長期信仰。























