基于python實現(xiàn)的多模型融合并行推理方法、裝置及系統(tǒng)
基本信息
申請?zhí)?/td> | CN202110392000.0 | 申請日 | - |
公開(公告)號 | CN112966825A | 公開(公告)日 | 2021-06-15 |
申請公布號 | CN112966825A | 申請公布日 | 2021-06-15 |
分類號 | G06N5/04(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王璐威;吳彰鵬 | 申請(專利權)人 | 杭州欣禾圣世科技有限公司 |
代理機構 | 杭州創(chuàng)信知識產(chǎn)權代理有限公司 | 代理人 | 楊燕霞 |
地址 | 311100浙江省杭州市余杭區(qū)余杭街道文一西路1818-2號6幢406室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開一種基于python實現(xiàn)的多模型融合并行推理方法,包括獲取參與推理的多個異構模型,將多個異構模型按照預設規(guī)則轉換成標準子模型;將每個子模型的結構和權重字典與總模型的每條分支相互對應,基于每個子模型的結構和權重字典將每個標準子模型融合成總模型;將總模型加載至GPU中,并對融合后的總模型進行推理驗證;定義總模型的輸出為每個子模型的輸出組成的列表,通過列表索引將總模型的推理結果映射回子模型。推理效率高,相較于多進程、多線程并行推理方法,本發(fā)明只在一個進程中運行,沒有進程間、線程間的調(diào)度問題,效率更高。節(jié)約存儲資源,將多個子模型融合為一個總模型,相較于多進程方法,本發(fā)明只需一份輸入數(shù)據(jù),節(jié)約了存儲資源。 |
