預(yù)訓(xùn)練模型訓(xùn)練處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202210234103.9 申請(qǐng)日 -
公開(公告)號(hào) CN114676761A 公開(公告)日 2022-06-28
申請(qǐng)公布號(hào) CN114676761A 申請(qǐng)公布日 2022-06-28
分類號(hào) G06K9/62(2022.01)I;G06N3/08(2006.01)I;G06T1/20(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 賈超;鄭直 申請(qǐng)(專利權(quán))人 北京智源人工智能研究院
代理機(jī)構(gòu) 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司 代理人 -
地址 100080北京市海淀區(qū)中關(guān)村東路1號(hào)院8號(hào)樓三層B201D-1
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種預(yù)訓(xùn)練模型訓(xùn)練處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),所述方法應(yīng)用于對(duì)待處理模型進(jìn)行訓(xùn)練處理的服務(wù)器,所述服務(wù)器包括多個(gè)圖形處理器,所述方法包括:將關(guān)于所述待處理模型的訓(xùn)練數(shù)據(jù)分?jǐn)傊粮鱾€(gè)所述圖形處理器;基于數(shù)據(jù)并行技術(shù),通過各個(gè)所述圖形處理器對(duì)所述訓(xùn)練數(shù)據(jù)進(jìn)行分布式計(jì)算,用以實(shí)現(xiàn)對(duì)所述待處理模型進(jìn)行訓(xùn)練。通過本發(fā)明提供的預(yù)訓(xùn)練模型訓(xùn)練處理方法,可以確保待處理模型能夠在較小的空間占用下實(shí)現(xiàn)高效訓(xùn)練。