活動圍繞“國產(chǎn)AI算力產(chǎn)業(yè)鏈實現(xiàn)閉環(huán)”這一主題,邀請AI算力產(chǎn)業(yè)鏈上下游企業(yè)及技術專家,包括中國移動、財躍星辰、騰訊云、沐曦、新華三、中科創(chuàng)星、無問芯穹、后摩智能、中昊芯英等行業(yè)頭部及明星企業(yè)。內(nèi)容覆蓋從算力芯片到算法模型再到算力服務的全鏈條環(huán)節(jié),展現(xiàn)了國產(chǎn)AI從技術突破到生態(tài)構(gòu)建的整體進展,也標志著中國在科技自主化道路上的堅實腳步。
“聚力向芯 算涌無界 Networking for AI”生態(tài)沙龍活動
在開場致辭環(huán)節(jié),中國信通院華東分院總工程師陳俊琰表示,“在國家戰(zhàn)略指引和地方政策推動下,上海智能算力產(chǎn)業(yè)已形成‘基礎夯實、創(chuàng)新活躍、場景豐富’的良好態(tài)勢。面向上海要實現(xiàn)智能算力產(chǎn)業(yè)高質(zhì)量發(fā)展,他提出了三點建議:一是強化技術創(chuàng)新協(xié)同,突破核心瓶頸。二是完善算力調(diào)度體系,提升配置效率。三是深化場景融合應用,賦能實體經(jīng)濟。中國信通院華東分院將繼續(xù)發(fā)揮‘國家高端專業(yè)智庫、產(chǎn)業(yè)創(chuàng)新發(fā)展平臺’的作用,在算力領域的政策研究、標準制定、測試認證、生態(tài)建設等方面提供更有力的支撐。”
奇異摩爾聯(lián)合創(chuàng)始人、產(chǎn)品解決方案副總裁?|表示,“當前智算中心的建設模式已經(jīng)從過去單純的硬件采購發(fā)展為更深入的生態(tài)適配與共建。這一轉(zhuǎn)型高度依賴于產(chǎn)業(yè)鏈各環(huán)節(jié)的互聯(lián)互通與開放合作。作為產(chǎn)業(yè)鏈的一環(huán),奇異摩爾具備橫跨AI產(chǎn)業(yè)鏈系統(tǒng)級、芯片級與芯粒級的全棧互聯(lián)產(chǎn)品解決方案及服務能力。依托我們在計算+網(wǎng)絡雙重維度的深厚技術積累,期待與產(chǎn)業(yè)伙伴協(xié)同創(chuàng)新,共同突破國產(chǎn)算力瓶頸,構(gòu)建開放、開源的國產(chǎn)算力新生態(tài)”。
互聯(lián)技術迎來價值躍遷
當前人工智能正引領全球邁入全新發(fā)展階段。在AI Scaling Law的新范式驅(qū)動下,大模型技術從基座模型突破到推理模型躍遷的變革中迎來基礎設施全面升級的新一輪轉(zhuǎn)型期,算力已成為當下國力角逐的重要維度。超大規(guī)模智算集群技術突破和工程落地、智能算力統(tǒng)籌規(guī)劃,以及數(shù)據(jù)、算力、電力、網(wǎng)絡等多種資源的協(xié)同配合,已被國家提升至戰(zhàn)略層面。
國務院印發(fā)《關于深入實施“人工智能+”行動的意見》,明確提出要強化8項基礎支撐能力,包括提升模型基礎能力、加強數(shù)據(jù)供給創(chuàng)新、強化智能算力統(tǒng)籌、優(yōu)化應用發(fā)展環(huán)境、促進開源生態(tài)繁榮等。工信部也聯(lián)合多部門發(fā)文,強調(diào)以新一代通信技術為驅(qū)動,構(gòu)建覆蓋感知、傳輸、存儲與計算的基礎設施體系,并合理布局區(qū)域樞紐節(jié)點,逐步提高智能算力占比。
隨著AI推理的落地、算力集群建設提速,互聯(lián)技術作為構(gòu)建AI基礎設施的關鍵環(huán)節(jié)正發(fā)揮越來越關鍵的作用。高帶寬、低時延的互聯(lián)能力,已成為提升模型性能、降低成本、實現(xiàn)普惠AI的重要路徑。
在Scale-up網(wǎng)絡側(cè),超節(jié)點正在發(fā)揮算力集群“神經(jīng)中樞”的核心價值,通過將成百上千張GPU互聯(lián),幫助構(gòu)建內(nèi)部高速、低延遲的通信網(wǎng)絡,提升系統(tǒng)的效率與計算上限,支撐大規(guī)模模型的訓練和并行推理。
互聯(lián)技術及相關業(yè)務,已經(jīng)成為英偉達的戰(zhàn)略支柱。英偉達專為GPU間通信,設計了點對點的高速互聯(lián)技術NVLink,最新的NVLink 5.0為每個Blackwell GPU提供高達1.8TB/s的雙向帶寬。同時,為實現(xiàn)多GPU的全互聯(lián),英偉達引入了NVSwitch芯片,在GB200 NVL72系統(tǒng)中,通過18顆NVLink 5 Switch芯片,構(gòu)建了總帶寬高達130TB/s的72 GPU NVLink域。
奇異摩爾作為國內(nèi)AI網(wǎng)絡互聯(lián)領域極少數(shù)可提供全棧式互聯(lián)產(chǎn)品架構(gòu)及解決方案的供應商,公司市場定位與方案優(yōu)勢,在算力集群互聯(lián)發(fā)展正當其時的趨勢之下,同樣值得關注。
依托于高性能RDMA和芯粒技術,構(gòu)建了一整套覆蓋面向北向Scale-out網(wǎng)間互聯(lián)、面向南向Scale-up超節(jié)點GPU片間互聯(lián),以及Scale-inside芯片內(nèi)互聯(lián)的產(chǎn)品解決方案,為AI高性能計算提供了堅實的支撐。
針對構(gòu)建千卡規(guī)模超節(jié)點HBD域,奇異摩爾的Kiwi G2G IO Die超節(jié)點互聯(lián)芯粒,是業(yè)內(nèi)少有的基于開源系統(tǒng)的超節(jié)點片間互聯(lián)方案,具有高帶寬、低延時的特性,可以實現(xiàn)TB級別的帶寬。G2G IOD在支持消息語義的同時,進一步支持內(nèi)存語義,通過與GPU廠商、云廠商及交換機廠商持續(xù)協(xié)作適配,全面賦能國產(chǎn)算力的開源閉環(huán)。
在Scale-out網(wǎng)絡側(cè),奇異摩爾打造的Kiwi SNIC AI原生超級網(wǎng)卡,性能可對標主流國際高性能ASIC產(chǎn)品,支持高達800Gbps的傳輸帶寬,提供低至μs級的數(shù)據(jù)傳輸延時,能夠滿足當前智算中心對網(wǎng)絡傳輸?shù)纳壭枨,實現(xiàn)Tb級別萬卡集群間的無損數(shù)據(jù)傳輸。
奇異摩爾首席網(wǎng)絡技術專家葉棟在活動演講中表示,“奇異摩爾的超節(jié)點互聯(lián)芯粒及AI原生超級網(wǎng)卡均基于Kiwi NDSA統(tǒng)一技術平臺,采用HPDE高性能可編程架構(gòu)設計,該架構(gòu)下產(chǎn)品具有優(yōu)秀性能的同時還兼顧靈活性。相比英偉達等互聯(lián)技術,能更好地支持市面上不同算力服務商的最新技術標準和網(wǎng)絡環(huán)境,實現(xiàn)高性能,可靠性與靈活性的融合。”
奇異摩爾首席網(wǎng)絡技術專家葉棟
在提升行業(yè)單芯片算力技術方面,奇異摩爾的片內(nèi)互聯(lián)方案,基于UCIe的D2D IP及Central IO Die及3D Base Die系列,可賦能AI芯片/高性能芯片的算力提升,進一步提升AI網(wǎng)絡的單卡算力。
以先進互聯(lián)技術助推產(chǎn)業(yè)共建,打造中國自主創(chuàng)新閉環(huán)
DeepSeek的出現(xiàn)為AI行業(yè)帶來算法變革,激發(fā)海量且多樣化的算力需求。為解決集群運行效率,超節(jié)點等互聯(lián)技術的發(fā)展已經(jīng)勢在必行。而這些技術的產(chǎn)業(yè)化落地,亟需依托覆蓋全方案、全產(chǎn)業(yè)鏈的互聯(lián)技術標準架構(gòu)作為牽引,縱向支撐智算集群性能擴展。
在此背景下,中國移動、新華三、沐曦等行業(yè)頭部企業(yè),正在發(fā)揮各自產(chǎn)業(yè)優(yōu)勢,推動集群算力與互聯(lián)技術實現(xiàn)規(guī)模化系統(tǒng)級部署。今年8月,中國移動聯(lián)合國內(nèi)數(shù)十家運營商、互聯(lián)網(wǎng)企業(yè)、芯片廠商、服務器制造商及科研院所,共同啟動智算開放互聯(lián)OISA生態(tài)共建戰(zhàn)略合作,并發(fā)布OISA 2.0協(xié)議。OISA 2.0進一步將支持的AI芯片數(shù)量提升至1024 張,帶寬突破TB/s級別,AI芯片互聯(lián)時延縮短至數(shù)百納秒,為大模型訓練、推理及高性能計算等數(shù)據(jù)密集型AI應用提供有力支撐。
“OISA致力于打破傳統(tǒng)Scale-up協(xié)議在帶寬與延遲上的固有瓶頸,其核心價值顯著且深遠,不僅為業(yè)界拓展了下一代計算與網(wǎng)絡一體化的技術路線選擇,更明確了OISA IP、OISA IO芯粒等互聯(lián)承載物的關鍵設計方向,為構(gòu)建開放協(xié)同的產(chǎn)業(yè)生態(tài)、筑牢未來智算中心的發(fā)展根基,提供了極具指導意義的關鍵藍圖。”中國移動研究院技術經(jīng)理李鍇在演講中特別強調(diào),“作為OISA體系的積極踐行者,奇異摩爾深度投身生態(tài)建設,在協(xié)議及IO芯粒的標準制定與產(chǎn)品研發(fā)中全力推進生態(tài)適配,為《OISA全向智感互聯(lián)IO芯粒技術白皮書》的編撰貢獻了關鍵力量。”
OISA生態(tài)共建戰(zhàn)略合作啟動儀式
沐曦作為國產(chǎn)AI算力芯片的頭部企業(yè),已形成以旗艦產(chǎn)品曦云C500為代表的完整產(chǎn)品線,涵蓋芯片、板卡、服務器及多形態(tài)超節(jié)點乃至千卡集群,具備從底層硬件到數(shù)據(jù)中心部署的全鏈路解決方案。同時,沐曦還創(chuàng)新多種超節(jié)點形態(tài),包括光互連超節(jié)點、耀龍3D Mesh超節(jié)點、Shanghai Cube國產(chǎn)高密度液冷整機柜等,將為構(gòu)建安全可控、場景適配的國產(chǎn)算力體系提供有生力量。
沐曦股份研究院院長李兆石在活動上表示,“超節(jié)點互聯(lián)協(xié)議設計需要算網(wǎng)融合。當前超節(jié)點使用的互聯(lián)協(xié)議雖然能滿足基本需求,但還有很大的性能提升空間。國內(nèi)智算產(chǎn)業(yè)需要上下游協(xié)同,才能做出媲美國際先進水平的產(chǎn)品。”
新華三發(fā)布的全新H3C UniPoD系列超節(jié)點基于多元算力生態(tài),開放兼容以太網(wǎng)和PCIe協(xié)議雙技術路線,實現(xiàn)高性能Scale-up互聯(lián)。該系列支持整機柜液冷集成交付與節(jié)點機柜解耦交付,并通過軟硬協(xié)同優(yōu)化實現(xiàn)快速業(yè)務構(gòu)建與全棧能力交付。UniPoD能夠?qū)崿F(xiàn)單機柜最高64卡GPU間的高速互聯(lián)互通,可為萬億級參數(shù)大模型訓練及推理提供更強勁、更智能、更綠色的算力供給。
中科創(chuàng)星董事總經(jīng)理盧小保表示:“算力、存力、互聯(lián)是AI底層硬件的核心。AI算力需求趨勢是由單體智能往群體智能發(fā)展,Scaling Law下,互聯(lián)的作用越來越凸顯,片內(nèi)互聯(lián)、片間互聯(lián)、卡間互聯(lián)、超級點內(nèi)互聯(lián),到集群互聯(lián),在不同技術層面上,互聯(lián)成了延續(xù)摩爾定律、不斷提升算力密度的核心解決路徑。在國內(nèi)先進工藝受限的情況下,互聯(lián)更是具備特殊價值,讓國內(nèi)算力產(chǎn)業(yè)可以以規(guī)模和成本換性能,實現(xiàn)算力自立。”
此外,本次AI生態(tài)沙龍還得到了來自階躍星辰合資企業(yè)財躍星辰、騰訊云、中昊芯英、無問芯穹、后摩智能等行業(yè)頭部企業(yè)技術專家的大力支持。
業(yè)內(nèi)投資專家曾指出:“未來三年,誰能把國產(chǎn)算力高效‘連’起來,誰就能贏得AI基礎設施的賽點。”互聯(lián),這個曾經(jīng)被忽視的技術角落,正成為國產(chǎn)AI算力能否真正實現(xiàn)閉環(huán)的關鍵一戰(zhàn)。