一種基于音素對數(shù)似然比的時延神經(jīng)網(wǎng)絡(luò)的聲紋識別方法
基本信息
申請?zhí)?/td> | CN202110752463.3 | 申請日 | - |
公開(公告)號 | CN113470655A | 公開(公告)日 | 2021-10-01 |
申請公布號 | CN113470655A | 申請公布日 | 2021-10-01 |
分類號 | G10L17/02(2013.01)I;G10L17/18(2013.01)I;G10L17/20(2013.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 劉俊南;薛輝;繆蔚;郭鵬;齊心 | 申請(專利權(quán))人 | 因諾微科技(天津)有限公司 |
代理機(jī)構(gòu) | 天津諾德知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) | 代理人 | 朱卉 |
地址 | 300000天津市濱海新區(qū)華苑產(chǎn)業(yè)區(qū)(環(huán)外)海泰發(fā)展五道16號B-6號樓-1-502 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種基于音素對數(shù)似然比的時延神經(jīng)網(wǎng)絡(luò)的聲紋識別方法,所述方法包括步驟:獲取語音數(shù)據(jù);對所述語音數(shù)據(jù)進(jìn)行預(yù)處理;使用音素識別器對預(yù)處理后的所述語音數(shù)據(jù)提取音素后驗概率向量;使用預(yù)處理后的所述語音數(shù)據(jù)訓(xùn)練時延神經(jīng)網(wǎng)絡(luò)并提取X?vector辨別矢量;使用所述音素后驗概率向量訓(xùn)練混合高斯模型?通用背景模型;使用所述混合高斯模型?通用背景模型計算I?vector辨別矢量;消除I?vector特征空間中信道信息影響;使用所述X?vector辨別矢量和所述I?vector辨別矢量生成新分類器;將X?vector特征和I?vector特征輸入所述新分類器;獲取所述新分類器的聲紋信息輸出。本申請能夠?qū)β暭y的信息進(jìn)行快速準(zhǔn)確的識別,提升系統(tǒng)的魯棒性,且可以跨平臺使用。 |
