一種基于版本差異的流水線并行訓練節(jié)點權重分配方法

基本信息

申請?zhí)?/td> CN202110766607.0 申請日 -
公開(公告)號 CN113469341A 公開(公告)日 2021-10-01
申請公布號 CN113469341A 申請公布日 2021-10-01
分類號 G06N3/04(2006.01)I;G06N3/063(2006.01)I;G06N3/08(2006.01)I;G06F9/38(2006.01)I 分類 計算;推算;計數;
發(fā)明人 毛鶯池;屠子健;聶華;黃建新;徐淑芳;吳俊;戚榮志 申請(專利權)人 中科可控信息產業(yè)有限公司
代理機構 南京樂羽知行專利代理事務所(普通合伙) 代理人 李玉平
地址 211100江蘇省南京市江寧開發(fā)區(qū)佛城西路8號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種基于版本差異的流水線并行訓練節(jié)點權重分配方法,載入初始化深度學習模型;構建流水線并行訓練方案,采用異步參數更新方法,并發(fā)執(zhí)行不同批次的訓練,記錄訓練批次在單位流水線執(zhí)行時間內完成前向和后向傳遞過程。利用最新的訓練節(jié)點權重版本,預測出未來訓練過程的節(jié)點權重,根據節(jié)點權重預測進行該批次版本差異計算。待該節(jié)點完成所有批次的版本差異計算,則完成該節(jié)點的預測權重更新。計算了所有節(jié)點的版本差異,即完成流水線并行訓練節(jié)點權重分配;并將其部署到異構計算節(jié)點中,得到針對擬訓練目標網絡的流水線并行訓練節(jié)點權重分配方案。本發(fā)明方法使節(jié)點權重預測更加準確。