BERT模型的優(yōu)化方法及系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202011517527.3 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112506523A | 公開(kāi)(公告)日 | 2021-03-16 |
申請(qǐng)公布號(hào) | CN112506523A | 申請(qǐng)公布日 | 2021-03-16 |
分類(lèi)號(hào) | G06F8/41(2018.01)I;G06N3/04(2006.01)I;G06F17/16(2006.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 周姍;周健倩;李健 | 申請(qǐng)(專(zhuān)利權(quán))人 | 上海攜旅信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 上海弼興律師事務(wù)所 | 代理人 | 楊東明;張冉 |
地址 | 201803上海市嘉定區(qū)金園一路1331號(hào)401室-4 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種BERT模型的優(yōu)化方法及系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì),提供了一種BERT模型的優(yōu)化方法,所述優(yōu)化方法包括:將所述BERT模型每個(gè)層包含的所有算子分別合并為一個(gè)對(duì)應(yīng)的層算子,所述層算子的數(shù)量和所述BERT模型的層數(shù)相同;每個(gè)層算子分別用于所述BERT模型中對(duì)應(yīng)層的運(yùn)算。本發(fā)明通過(guò)對(duì)BERT模型的各個(gè)層進(jìn)行算子融合處理優(yōu)化了模型處理處理過(guò)程,在不改變模型結(jié)構(gòu)和模型精度的前提下加快了模型的推理速度,提高了BERT模型的處理效率。?? |
