一種基于雙層知識(shí)蒸餾說話人模型壓縮系統(tǒng)和方法

基本信息

申請(qǐng)?zhí)?/td> CN202011079752.3 申請(qǐng)日 -
公開(公告)號(hào) CN112712099A 公開(公告)日 2021-04-27
申請(qǐng)公布號(hào) CN112712099A 申請(qǐng)公布日 2021-04-27
分類號(hào) G06K9/62;G10L15/22 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李入云;宋丹丹;歐陽鵬;尹首一 申請(qǐng)(專利權(quán))人 江蘇清微智能科技有限公司
代理機(jī)構(gòu) 北京索睿邦知識(shí)產(chǎn)權(quán)代理有限公司 代理人 李根
地址 211100 江蘇省南京市江寧區(qū)麒麟科技創(chuàng)新園創(chuàng)研路266號(hào)人工智能產(chǎn)業(yè)園8號(hào)樓3層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種基于雙層知識(shí)蒸餾說話人模型壓縮系統(tǒng)和方法,屬于立體匹配算法的實(shí)現(xiàn)方式技術(shù)領(lǐng)域。包括:Embedding層知識(shí)蒸餾指導(dǎo)學(xué)生網(wǎng)絡(luò)模仿教師網(wǎng)絡(luò)的段級(jí)說話人表示(說話人表征),它捕獲了每個(gè)說話人特征的基本分布。Logit層知識(shí)蒸餾引導(dǎo)學(xué)生網(wǎng)絡(luò)模仿教師網(wǎng)絡(luò)的說話人后驗(yàn)概率分布,利用了說話人類別之間的相似性。此方法從教師網(wǎng)絡(luò)那里遷移了說話人表征分布的層次結(jié)構(gòu)。本發(fā)明解決了現(xiàn)有技術(shù)中學(xué)生網(wǎng)絡(luò)不能實(shí)現(xiàn)較小的說話人類內(nèi)差異和較大的說話人類間差異,且相同說話人和不同說話人驗(yàn)證系統(tǒng)的準(zhǔn)確性較低的問題。