光子技術(shù)加速數(shù)據(jù)中心AI發(fā)展
光子技術(shù)(Photonics)在數(shù)據(jù)中心AI加速中扮演著日益重要的角色。
光學(xué)組件的全球市場(chǎng)規(guī)模已相當(dāng)可觀,去年收入達(dá)170億美元。歷史上,電信領(lǐng)域(如海底光纜和光纖到戶)主導(dǎo)了需求。然而,如今數(shù)據(jù)通信領(lǐng)域,尤其是AI驅(qū)動(dòng)的數(shù)據(jù)中心,已占據(jù)市場(chǎng)超60%的份額。這一轉(zhuǎn)變正在加速光學(xué)技術(shù)的增長(zhǎng)。
為匹配AI計(jì)算集群(包括GPU和定制加速器在內(nèi)的xPU)不斷提升的性能,光學(xué)傳輸速率正迅速提高。
圖1:光學(xué)組件市場(chǎng)歷史與預(yù)測(cè)。來(lái)源:OMDIA/OFC
據(jù)J.P. Morgan數(shù)據(jù),最大的光學(xué)組件供應(yīng)商為Coherent和Innolight(各占20%市場(chǎng)份額),其次是Broadcom,占10%。眾多中小供應(yīng)商也在為這一擴(kuò)展生態(tài)系統(tǒng)貢獻(xiàn)力量。
由LLM驅(qū)動(dòng)的AI數(shù)據(jù)中心增長(zhǎng)
LLM正推動(dòng)AI工作負(fù)載呈指數(shù)級(jí)增長(zhǎng)。隨著AI能力提升和成本降低,需求激增。LLM規(guī)模的擴(kuò)大需要龐大的xPU集群?;ミB需求增長(zhǎng)速度超過(guò)xPU數(shù)量本身,迫切需要高帶寬、低延遲的網(wǎng)絡(luò)解決方案。
Broadcom首席執(zhí)行官Hock Tan指出,數(shù)據(jù)中心網(wǎng)絡(luò)成本正不斷攀升,從目前的資本支出的5%-10%預(yù)計(jì)到2030年將升至15%-20%。
圖2:AI集群規(guī)模激增。來(lái)源:Dell'Oro Group/OFC
例如,Oracle云基礎(chǔ)設(shè)施(OCI)部署了包含131,000個(gè)Nvidia Blackwell GPU的集群,通過(guò)NVLink72實(shí)現(xiàn)互連。
圖3:Oracle云基礎(chǔ)設(shè)施面向生成式AI的超大規(guī)模集群產(chǎn)品。來(lái)源:Oracle/OFC
Scale-Out與Scale-Up網(wǎng)絡(luò)
在AI數(shù)據(jù)中心,互連主要分為兩種類型:
- Scale-Out:光學(xué)鏈路連接機(jī)架和行之間的交換機(jī)。
- Scale-Up:電信號(hào)鏈路連接少量機(jī)架內(nèi)及機(jī)架間的GPU。
圖4:數(shù)據(jù)中心中的光學(xué)技術(shù)。來(lái)源:Coherent/OFC
雖然Scale-Out網(wǎng)絡(luò)已采用光學(xué)技術(shù),但Scale-Up網(wǎng)絡(luò)向光子技術(shù)的過(guò)渡正在進(jìn)行,尚未完全實(shí)現(xiàn)。
Scale-Out網(wǎng)絡(luò)的光學(xué)進(jìn)展
光子技術(shù)在Scale-Out架構(gòu)中占據(jù)核心地位。目前,可插拔光學(xué)收發(fā)器支持網(wǎng)卡(NIC)與交換機(jī)之間數(shù)十米的數(shù)據(jù)傳輸。隨著數(shù)據(jù)速率的提升,這些解決方案在功耗和性能方面面臨越來(lái)越大的限制。
Oracle的131000 GPU網(wǎng)絡(luò)在其Scale-Out網(wǎng)絡(luò)的三個(gè)層級(jí)均使用光學(xué)鏈路。然而,傳統(tǒng)可插拔光學(xué)器件功耗較高。
圖5:Oracle光學(xué)集群網(wǎng)絡(luò)架構(gòu)。來(lái)源:Oracle/OFC
圖6:功耗與TCO仍是主要關(guān)注點(diǎn)。來(lái)源:Meta/OFC
隨著Scale-Out網(wǎng)絡(luò)數(shù)據(jù)速率的增加,以滿足LLM增長(zhǎng)和吞吐量需求,網(wǎng)絡(luò)功耗已超過(guò)加速器機(jī)架的功耗。據(jù)Nvidia數(shù)據(jù),將可插拔光學(xué)器件轉(zhuǎn)為共封裝光學(xué)(Co-Packaged Optics, CPO),可將1.6Tbps鏈路的光學(xué)功耗從30W大幅降至9W。
在GTC25大會(huì)上,Nvidia推出了首款采用CPO的Scale-Out交換機(jī)。功耗的節(jié)省使GPU密度提升高達(dá)3倍,在相同數(shù)據(jù)中心功耗范圍內(nèi)支持更多GPU。
圖7:采用Spectrum-X光子技術(shù)實(shí)現(xiàn)3.5倍功耗節(jié)省。來(lái)源:Nvidia/GTC25
可靠性是從銅纜到光學(xué)再到CPO過(guò)渡中的關(guān)鍵考量。AI數(shù)據(jù)中心的組件規(guī)模龐大且增長(zhǎng)迅速,類似iPhone的生產(chǎn)節(jié)奏。產(chǎn)量和可靠性必須從一開(kāi)始就極高。谷歌平臺(tái)光學(xué)總監(jiān)表示,每日0.004%的鏈路故障率看似不錯(cuò),但在100萬(wàn)個(gè)鏈路中,這意味著每天40次鏈路故障。光學(xué)解決方案需設(shè)計(jì)為極低故障率,需在高要求水平下進(jìn)行測(cè)試,并以極大規(guī)模樣本驗(yàn)證,以確保生產(chǎn)擴(kuò)容成功。
Scale-Up網(wǎng)絡(luò)向CPO的路徑
目前,Scale-Up互連仍以銅纜為主。Nvidia的Blackwell架構(gòu)采用全銅解決方案NVLink72,板卡、交換機(jī)和機(jī)架背板上可見(jiàn)大量布線。信號(hào)頻率現(xiàn)已極高,銅纜束直接連接至GPU,繞過(guò)傳統(tǒng)PCB走線。
圖8:Nvidia的路線圖延伸至NVLink576,仍使用銅纜,但不斷提高的數(shù)據(jù)速率和信號(hào)完整性問(wèn)題最終將需要光學(xué)解決方案。來(lái)源:Nvidia/GTC
然而,銅纜的局限性日益明顯。Nvidia的路線圖延伸至NVLink576,仍使用銅纜,但不斷提高的數(shù)據(jù)速率和信號(hào)完整性問(wèn)題最終將需要光學(xué)解決方案。
微軟提出了其未來(lái)AI加速器對(duì)CPO的要求,希望用單一物理層和可配置接口取代現(xiàn)有接口。
圖9:新型互連場(chǎng)景需要統(tǒng)一的接口,具備更嚴(yán)格的延遲和可靠性要求。來(lái)源:Microsoft/OFC
這一新統(tǒng)一接口需兼具“兩全其美”——綜合規(guī)格優(yōu)于其替代的傳統(tǒng)接口。這對(duì)CPO提出了更高挑戰(zhàn),但也擴(kuò)大了市場(chǎng)。
圖10:新型統(tǒng)一接口需優(yōu)于其替代的傳統(tǒng)接口。來(lái)源:Microsoft/OFC
Nvidia也提出了其AI加速器對(duì)CPO集成的要求:
圖11:Nvidia的CPO要求。來(lái)源:Nvidia/OFC
這些要求具有挑戰(zhàn)性但可實(shí)現(xiàn)。Needham & Company建議,Scale-Up網(wǎng)絡(luò)向CPO的初步轉(zhuǎn)變將在單一GPU域內(nèi)的機(jī)架間互連中發(fā)生,而機(jī)架內(nèi)連接暫時(shí)仍以銅纜為主。
100%的AI數(shù)據(jù)中心芯片由臺(tái)積電(TSMC)制造。臺(tái)積電深度參與所有主要AI玩家的技術(shù)路線圖,僅開(kāi)發(fā)其主要客戶所需的技術(shù)。在4月底的年度技術(shù)大會(huì)上,臺(tái)積電展示了其AI芯片路線圖,包括共封裝光學(xué),表明其已為此做好準(zhǔn)備。
市場(chǎng)展望與行業(yè)參與者
預(yù)計(jì)Scale-Up網(wǎng)絡(luò)向CPO的過(guò)渡將在未來(lái)幾年內(nèi)開(kāi)始,并在2030年代廣泛取代可插拔光學(xué)器件。CPO市場(chǎng)將從目前的零增長(zhǎng)至2030年的50億美元。早期進(jìn)入者如Broadcom、Marvell、Ayar Labs、Celestial AI和Lightmatter,以及激光供應(yīng)商如Coherent,將從中受益。
圖12:光學(xué)技術(shù)快速增長(zhǎng),CPO預(yù)計(jì)于2027-2030年興起。來(lái)源:LightCounting/Coherent
光子技術(shù)不再僅是AI的使能者,而是其大規(guī)模增長(zhǎng)不可或缺的基石。到2030年代中期,所有互連都將是光學(xué)的,且全部采用CPO。
參考資料:Tate, G. (2025, May 1). Photonics speeds up data center AI. Semiconductor Engineering. Retrieved from https://semiengineering.com/photonics-speeds-up-data-center-ai/
本文轉(zhuǎn)載自??Andy730??,作者:常華?
