一種基于音素對數(shù)似然比的時延神經(jīng)網(wǎng)絡(luò)的聲紋識別方法

基本信息

申請?zhí)?/td> CN202110752463.3 申請日 -
公開(公告)號 CN113470655A 公開(公告)日 2021-10-01
申請公布號 CN113470655A 申請公布日 2021-10-01
分類號 G10L17/02(2013.01)I;G10L17/18(2013.01)I;G10L17/20(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 劉俊南;薛輝;繆蔚;郭鵬;齊心 申請(專利權(quán))人 因諾微科技(天津)有限公司
代理機(jī)構(gòu) 天津諾德知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 朱卉
地址 300000天津市濱海新區(qū)華苑產(chǎn)業(yè)區(qū)(環(huán)外)海泰發(fā)展五道16號B-6號樓-1-502
法律狀態(tài) -

摘要

摘要 一種基于音素對數(shù)似然比的時延神經(jīng)網(wǎng)絡(luò)的聲紋識別方法,所述方法包括步驟:獲取語音數(shù)據(jù);對所述語音數(shù)據(jù)進(jìn)行預(yù)處理;使用音素識別器對預(yù)處理后的所述語音數(shù)據(jù)提取音素后驗概率向量;使用預(yù)處理后的所述語音數(shù)據(jù)訓(xùn)練時延神經(jīng)網(wǎng)絡(luò)并提取X?vector辨別矢量;使用所述音素后驗概率向量訓(xùn)練混合高斯模型?通用背景模型;使用所述混合高斯模型?通用背景模型計算I?vector辨別矢量;消除I?vector特征空間中信道信息影響;使用所述X?vector辨別矢量和所述I?vector辨別矢量生成新分類器;將X?vector特征和I?vector特征輸入所述新分類器;獲取所述新分類器的聲紋信息輸出。本申請能夠?qū)β暭y的信息進(jìn)行快速準(zhǔn)確的識別,提升系統(tǒng)的魯棒性,且可以跨平臺使用。