外国成人免费视频_免费观看成人鲁鲁鲁鲁鲁视频_午夜视频在线观看免费视频_中文字幕日韩av电影_99在线精品免费_66精品视频在线观看_国产精品久久一_午夜电影久久久_永久91嫩草亚洲精品人人_麻豆传媒在线播放

聚焦大模型訓練效率提升 北大依托昇騰突破細粒度混合并行技術(shù)
來源:青橘網(wǎng) 發(fā)表于2025-08-01 15:59:09 編輯:沫曉朵
摘要: 在人工智能大模型迅猛發(fā)展的當下,大模型參數(shù)和計算量呈指數(shù)級增長,大規(guī)模深度學習模型的訓練離不開多硬件設(shè)備的分布式計算。在鯤鵬昇騰科教創(chuàng)新

  在人工智能大模型迅猛發(fā)展的當下,大模型參數(shù)和計算量呈指數(shù)級增長,大規(guī)模深度學習模型的訓練離不開多硬件設(shè)備的分布式計算。在鯤鵬昇騰科教創(chuàng)新卓越中心的算力支持下,北京大學計算機學院崔斌教授團隊創(chuàng)新研發(fā)了面向大模型的高效分布式訓練框架,大幅提升了大規(guī)模分布式訓練模型的效率。

  針對模型訓練任務(wù)的多樣性和復雜性所帶來的負載不均問題,研究團隊創(chuàng)新設(shè)計出了細粒度模型切分與并行策略搜索算法。此方法依托昇騰強大的計算資源管理能力,及算子優(yōu)化技術(shù)對訓練策略的適配,完成了統(tǒng)一訓練接口到智能切分策略的全過程。首先通過總結(jié)多種大模型訓練的共同特點,設(shè)計出統(tǒng)一的接口來啟動和管理不同任務(wù)負載的模型訓練任務(wù),對訓練時所花費的算力、內(nèi)存、網(wǎng)絡(luò)通信等進行精確地計算。接著基于這些數(shù)據(jù)細致拆解龐大且復雜的大模型,根據(jù)不同模塊分配不同的訓練策略以適應各模塊的負載差異,實現(xiàn)訓練任務(wù)的高效并行。目前,該方案已實現(xiàn)比分片數(shù)據(jù)并行、3D 并行等全局模版化并行方案提升15% 的訓練效率。

  除此之外,團隊還解決了分布式計算所涉及的硬件間通信傳輸效率問題。結(jié)合昇騰高速互聯(lián)總線技術(shù)的高帶寬低時延優(yōu)勢,系統(tǒng)會很根據(jù)不同的通信需求,對硬件設(shè)備進行分組以優(yōu)化組隊時間,運用計算通信重疊技術(shù)讓“計算”和“通信”同步進行,提高訓練流水線的效率,并在模型切分的決策時考慮計算通信重疊的性能影響,綜合多方面因素選取最適合的分布式運行方案,最終實現(xiàn)數(shù)據(jù)傳輸效率和資源利用率的最大化。

  該研究成果不僅為模型大規(guī)模訓練提供了高效的解決方案,更展現(xiàn)了自主算力在分布式計算領(lǐng)域的巨大潛力。目前,研究成果已在國際頂級學術(shù)會議NeurIPS、ICLR、AAAI發(fā)表3篇論文,為國內(nèi)AI技術(shù)突破提供了理論支撐與實踐范式。

  北京大學 鯤鵬昇騰科教創(chuàng)新卓越中心的這一突破彰顯了校企協(xié)同創(chuàng)新的顯著成效。未來,中心將持續(xù)加速AI前沿技術(shù)在自主計算平臺的深度落地,為我國人工智能產(chǎn)業(yè)的自主化突破提供強勁動能。

投稿郵箱:qingjuedu@163.com
相關(guān)推薦
這不對勁兒!教育各家AI功能越來越像了
這不對勁兒!教育各家AI功能越來越像了

來源| 作者|TCOH 編者按: 本文為約稿。作者TCOH為教育行業(yè)資深從業(yè)者。 過去一

快資訊31分鐘前

剝離教育等業(yè)務(wù)后,奇夢島2026財年Q1靠潮玩實現(xiàn)1.27億元
剝離教育等業(yè)務(wù)后,奇夢島2026財年Q1靠潮玩實現(xiàn)1.27億元

12月4日消息,近日,奇夢島(NASDAQ:HERE,量子之歌前身)披露了2026財年第一季度

快資訊8小時前

國內(nèi)首款AI助盲眼鏡發(fā)布,可實現(xiàn)避障、找物讀物、語
國內(nèi)首款AI助盲眼鏡發(fā)布,可實現(xiàn)避障、找物讀物、語

12月4日消息,杭州瞳行科技公司于本周正式發(fā)布國內(nèi)首款AI助盲眼鏡。 據(jù)介紹,

快資訊8小時前

樂隊鼓手創(chuàng)辦的職業(yè)規(guī)劃平臺融資500萬美元,已服務(wù)
樂隊鼓手創(chuàng)辦的職業(yè)規(guī)劃平臺融資500萬美元,已服務(wù)

12月4日消息,一體化職業(yè)規(guī)劃平臺Find Your Grind宣布完成500萬美元A輪融資,本輪

快資訊8小時前

清華大學具身智能與機器人研究院成立,掛靠科研院
清華大學具身智能與機器人研究院成立,掛靠科研院

12月3日消息,11月30日,清華大學具身智能與機器人研究院成立。 清華大學校長

快資訊2025-12-03 22:31:11

可靈AI發(fā)布“可靈O1”:整合文本、圖像、音頻等模態(tài)
可靈AI發(fā)布“可靈O1”:整合文本、圖像、音頻等模態(tài)

12月3日消息, 快手旗下可靈AI正式發(fā)布可靈O1,該產(chǎn)品定位為大一統(tǒng)的多模態(tài)創(chuàng)

快資訊2025-12-03 22:31:01

得力上海品牌旗艦店啟幕:以“超級體驗”重塑文具行
得力上海品牌旗艦店啟幕:以“超級體驗”重塑文具行

2025年11月29日,得力上海品牌旗艦店(deli world)在上海靜安大悅城盛大開業(yè)。這家

快資訊2025-12-03 17:56:06

2025"燃?朗文少年"青少年英語口語演講活動圓滿收官
2025"燃?朗文少年"青少年英語口語演講活動圓滿收官

六強少年閃耀北京舞臺,中國印尼跨國聯(lián)動呈現(xiàn)AI時代的未來表達力 由全球教育

快資訊2025-12-03 15:25:32

千問接入“阿里最強學習大模型”:拍題更準、講題更
千問接入“阿里最強學習大模型”:拍題更準、講題更

12月3日消息,阿里千問面向?qū)W習場景發(fā)布拍題答疑、作業(yè)批改兩項重要更新。通

快資訊2025-12-03 14:31:10

首款“豆包AI手機”售罄,二手平臺最高加價1500元
首款“豆包AI手機”售罄,二手平臺最高加價1500元

12月3日消息,首款搭載豆包手機助手的手機產(chǎn)品努比亞M153目前已在中興商城售

快資訊2025-12-03 14:31:01

?