中國(guó)聯(lián)通發(fā)布超1500公里跨域大模型異構(gòu)混訓(xùn)成果
IT之家7月20日消息,在2025中國(guó)聯(lián)通合作伙伴大會(huì)期間,中國(guó)聯(lián)通研究院聯(lián)合上海人工智能實(shí)驗(yàn)室等合作伙伴,于7月19日正式發(fā)布了全球最長(zhǎng)距離大模型異構(gòu)混訓(xùn)試驗(yàn)成果。

隨著人工智能技術(shù)快速發(fā)展和大模型時(shí)代加速到來,模型訓(xùn)練對(duì)算力基礎(chǔ)設(shè)施的高吞吐、低時(shí)延、高性能有了更高要求。但當(dāng)前算力資源呈現(xiàn)異構(gòu)化和多中心化格局,面臨跨域資源互聯(lián)互通機(jī)制不完善、長(zhǎng)距離傳輸存在帶寬和時(shí)延瓶頸、異構(gòu)資源統(tǒng)一調(diào)度與高效融合能力有限等挑戰(zhàn)。
在此情況下,中國(guó)聯(lián)通聯(lián)合上海人工智能實(shí)驗(yàn)室、阿里云、浪潮、基流科技、加佳科技等行業(yè)伙伴,面向國(guó)產(chǎn)異構(gòu)GPU環(huán)境,針對(duì)超大模型跨域訓(xùn)練和碎片化算力整合需求,依托“算力智聯(lián)網(wǎng)AINet”長(zhǎng)距無損傳輸技術(shù)優(yōu)勢(shì),結(jié)合上海人工智能實(shí)驗(yàn)室“DeepLink”超大規(guī)??缬蚧煊?xùn)技術(shù)方案,在上海臨港和山東濟(jì)南鮑山數(shù)據(jù)中心間構(gòu)建了長(zhǎng)度超1500公里的跨域異構(gòu)混訓(xùn)系統(tǒng)。
IT之家從大會(huì)了解到,聯(lián)合團(tuán)隊(duì)通過自動(dòng)調(diào)整多種并行策略和跨域收斂比下MoE模型和Dense模型的參數(shù)配置,完成了超1500公里跨域的千億參數(shù)AI大模型異構(gòu)混訓(xùn)試驗(yàn),經(jīng)驗(yàn)證等效算力可達(dá)單芯片單集群等效算力的95%以上。
在算力互聯(lián)方面,采用聯(lián)通自研內(nèi)置長(zhǎng)距RDMA協(xié)議棧的RoCE交換機(jī),滿足DC內(nèi)和DC間高性能網(wǎng)絡(luò)需求;
在算力調(diào)度與資源管理方面,通過聯(lián)通“智馭”平臺(tái)實(shí)現(xiàn)對(duì)跨域網(wǎng)絡(luò)和集群的統(tǒng)一管控及任務(wù)調(diào)度;
在算力協(xié)同方面,基于DeepLink在訓(xùn)練加速、異構(gòu)通信、并行策略等核心技術(shù),實(shí)現(xiàn)千億參數(shù)大模型在超長(zhǎng)距離異構(gòu)GPU環(huán)境下的高效訓(xùn)練。

中國(guó)聯(lián)通表示,上述成果標(biāo)志著其在算力基礎(chǔ)設(shè)施跨域協(xié)同調(diào)度、異構(gòu)資源融合與高性能分布式訓(xùn)練等關(guān)鍵領(lǐng)域?qū)崿F(xiàn)了實(shí)質(zhì)性技術(shù)突破,為下一代互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展奠定了基礎(chǔ)。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com






