模型部署方法、模型部署裝置、終端設(shè)備及可讀存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110567899.5 申請(qǐng)日 -
公開(公告)號(hào) CN113220457A 公開(公告)日 2021-08-06
申請(qǐng)公布號(hào) CN113220457A 申請(qǐng)公布日 2021-08-06
分類號(hào) G06F9/50;G06N3/10;G06N3/08;G06N3/04 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李發(fā)兵;林偉偉;李想;毛興中 申請(qǐng)(專利權(quán))人 交叉信息核心技術(shù)研究院(西安)有限公司
代理機(jī)構(gòu) 北京中巡通大知識(shí)產(chǎn)權(quán)代理有限公司 代理人 孟大帥
地址 710077 陜西省西安市高新區(qū)天谷八路軟件新城云匯谷156號(hào)B2座11層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種模型部署方法、模型部署裝置、終端設(shè)備及可讀存儲(chǔ)介質(zhì),所述方法包括以下步驟:獲取待部署深度神經(jīng)網(wǎng)絡(luò)模型的算子模型集合;將算子模型集合中滿足預(yù)設(shè)條件的算子模型進(jìn)行算子融合或算子分割處理,獲得處理后的算子模型集合;獲取所述處理后的算子模型集合中每個(gè)算子模型在用于部署模型的設(shè)備集合中的每個(gè)設(shè)備上的運(yùn)行時(shí)間,獲得運(yùn)行時(shí)間集合;基于所述運(yùn)行時(shí)間集合,采用預(yù)設(shè)搜索方法對(duì)所述處理后的算子模型集合中的算子模型進(jìn)行組合,獲得子模型集合;基于所述子模型集合,將待部署深度神經(jīng)網(wǎng)絡(luò)模型部署于所述設(shè)備集合上。本發(fā)明能夠充分兼容不同算力的設(shè)備,可提高運(yùn)行效率以及全局上的吞吐率。