語音真?zhèn)蔚尿?yàn)證方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110433396.9 申請(qǐng)日 -
公開(公告)號(hào) CN112992126B 公開(公告)日 2022-02-25
申請(qǐng)公布號(hào) CN112992126B 申請(qǐng)公布日 2022-02-25
分類號(hào) G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/08(2006.01)I;G10L25/51(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 鄭榕;鄭堯曦 申請(qǐng)(專利權(quán))人 北京遠(yuǎn)鑒信息技術(shù)有限公司
代理機(jī)構(gòu) 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 代理人 劉鳳
地址 100000北京市海淀區(qū)西四環(huán)北路158號(hào)1幢7層80001-2
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┝苏Z音真?zhèn)蔚尿?yàn)證方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì),包括:獲取待識(shí)別語音;將待識(shí)別語音輸入預(yù)先訓(xùn)練好的聲音特征提取網(wǎng)絡(luò),得到目標(biāo)特征向量;目標(biāo)特征向量包含用于區(qū)分聲音來源的待識(shí)別語音的時(shí)序信息以及音素長(zhǎng)時(shí)對(duì)應(yīng)信息;將目標(biāo)特征向量輸入至預(yù)先訓(xùn)練好的分類模型中,確定待識(shí)別語音是否為真實(shí)用戶發(fā)出的;分類模型是基于最大互信息準(zhǔn)則進(jìn)行訓(xùn)練的,用于區(qū)分真實(shí)語音與偽造語音。這樣,可以提取出針對(duì)于語音活體檢測(cè)的聲音特征,有助于提高識(shí)別待識(shí)別語音是否是來自于真實(shí)用戶的準(zhǔn)確率,同時(shí)利用區(qū)分度更高更不易混淆的分類模型進(jìn)行分類,可以提高對(duì)聲音分類的準(zhǔn)確性,從而提高了對(duì)語音是否為真實(shí)用戶發(fā)出的識(shí)別的準(zhǔn)確性。