BERT模型的優(yōu)化方法及系統(tǒng)、電子設(shè)備及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202011517527.3 | 申請日 | - |
公開(公告)號 | CN112506523A | 公開(公告)日 | 2021-03-16 |
申請公布號 | CN112506523A | 申請公布日 | 2021-03-16 |
分類號 | G06F8/41(2018.01)I;G06N3/04(2006.01)I;G06F17/16(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 周姍;周健倩;李健 | 申請(專利權(quán))人 | 上海攜旅信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 上海弼興律師事務(wù)所 | 代理人 | 楊東明;張冉 |
地址 | 201803上海市嘉定區(qū)金園一路1331號401室-4 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種BERT模型的優(yōu)化方法及系統(tǒng)、電子設(shè)備及存儲介質(zhì),提供了一種BERT模型的優(yōu)化方法,所述優(yōu)化方法包括:將所述BERT模型每個層包含的所有算子分別合并為一個對應(yīng)的層算子,所述層算子的數(shù)量和所述BERT模型的層數(shù)相同;每個層算子分別用于所述BERT模型中對應(yīng)層的運(yùn)算。本發(fā)明通過對BERT模型的各個層進(jìn)行算子融合處理優(yōu)化了模型處理處理過程,在不改變模型結(jié)構(gòu)和模型精度的前提下加快了模型的推理速度,提高了BERT模型的處理效率。?? |
