語音真?zhèn)蔚尿?yàn)證方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202110433396.9 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112992126B | 公開(公告)日 | 2022-02-25 |
申請(qǐng)公布號(hào) | CN112992126B | 申請(qǐng)公布日 | 2022-02-25 |
分類號(hào) | G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/08(2006.01)I;G10L25/51(2013.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 鄭榕;鄭堯曦 | 申請(qǐng)(專利權(quán))人 | 北京遠(yuǎn)鑒信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) | 代理人 | 劉鳳 |
地址 | 100000北京市海淀區(qū)西四環(huán)北路158號(hào)1幢7層80001-2 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)?zhí)峁┝苏Z音真?zhèn)蔚尿?yàn)證方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì),包括:獲取待識(shí)別語音;將待識(shí)別語音輸入預(yù)先訓(xùn)練好的聲音特征提取網(wǎng)絡(luò),得到目標(biāo)特征向量;目標(biāo)特征向量包含用于區(qū)分聲音來源的待識(shí)別語音的時(shí)序信息以及音素長(zhǎng)時(shí)對(duì)應(yīng)信息;將目標(biāo)特征向量輸入至預(yù)先訓(xùn)練好的分類模型中,確定待識(shí)別語音是否為真實(shí)用戶發(fā)出的;分類模型是基于最大互信息準(zhǔn)則進(jìn)行訓(xùn)練的,用于區(qū)分真實(shí)語音與偽造語音。這樣,可以提取出針對(duì)于語音活體檢測(cè)的聲音特征,有助于提高識(shí)別待識(shí)別語音是否是來自于真實(shí)用戶的準(zhǔn)確率,同時(shí)利用區(qū)分度更高更不易混淆的分類模型進(jìn)行分類,可以提高對(duì)聲音分類的準(zhǔn)確性,從而提高了對(duì)語音是否為真實(shí)用戶發(fā)出的識(shí)別的準(zhǔn)確性。 |
