一種基于雙層知識(shí)蒸餾說話人模型壓縮系統(tǒng)和方法
基本信息
申請(qǐng)?zhí)?/td> | CN202011079752.3 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112712099A | 公開(公告)日 | 2021-04-27 |
申請(qǐng)公布號(hào) | CN112712099A | 申請(qǐng)公布日 | 2021-04-27 |
分類號(hào) | G06K9/62;G10L15/22 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 李入云;宋丹丹;歐陽鵬;尹首一 | 申請(qǐng)(專利權(quán))人 | 江蘇清微智能科技有限公司 |
代理機(jī)構(gòu) | 北京索睿邦知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 李根 |
地址 | 211100 江蘇省南京市江寧區(qū)麒麟科技創(chuàng)新園創(chuàng)研路266號(hào)人工智能產(chǎn)業(yè)園8號(hào)樓3層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開一種基于雙層知識(shí)蒸餾說話人模型壓縮系統(tǒng)和方法,屬于立體匹配算法的實(shí)現(xiàn)方式技術(shù)領(lǐng)域。包括:Embedding層知識(shí)蒸餾指導(dǎo)學(xué)生網(wǎng)絡(luò)模仿教師網(wǎng)絡(luò)的段級(jí)說話人表示(說話人表征),它捕獲了每個(gè)說話人特征的基本分布。Logit層知識(shí)蒸餾引導(dǎo)學(xué)生網(wǎng)絡(luò)模仿教師網(wǎng)絡(luò)的說話人后驗(yàn)概率分布,利用了說話人類別之間的相似性。此方法從教師網(wǎng)絡(luò)那里遷移了說話人表征分布的層次結(jié)構(gòu)。本發(fā)明解決了現(xiàn)有技術(shù)中學(xué)生網(wǎng)絡(luò)不能實(shí)現(xiàn)較小的說話人類內(nèi)差異和較大的說話人類間差異,且相同說話人和不同說話人驗(yàn)證系統(tǒng)的準(zhǔn)確性較低的問題。 |
