一種采用感知聽覺場景分析的缺失數(shù)據(jù)特征說話人識別方法

基本信息

申請?zhí)?/td> CN201610114968.6 申請日 -
公開(公告)號 CN106448680A 公開(公告)日 2017-02-22
申請公布號 CN106448680A 申請公布日 2017-02-22
分類號 G10L17/02(2013.01)I;G10L17/20(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 吳迪;陶智;趙鶴鳴;張曉俊;肖仲喆;馮哲 申請(專利權(quán))人 常熟蘇大低碳應(yīng)用技術(shù)研究院有限公司
代理機(jī)構(gòu) 南京知識律師事務(wù)所 代理人 汪旭東
地址 215500 江蘇省蘇州市常熟市東南經(jīng)濟(jì)開發(fā)區(qū)東南大道68號1幢
法律狀態(tài) -

摘要

摘要 本發(fā)明針對現(xiàn)有的缺失數(shù)據(jù)特征方法在低信噪比環(huán)境下魯棒性較差的問題,提出了一種感知聽覺場景分析(Perception?Auditory?Scene?Analysis,PASA)的MDF提取方法,進(jìn)一步提高M(jìn)DF方法的魯棒性。PASA方法解決了兩個(gè)關(guān)鍵問題。一,由oracle掩碼估計(jì)出的可靠語音并不完全正確,特別在低信噪比的情況下,噪聲的隨機(jī)特性導(dǎo)致很多噪聲特征譜被估計(jì)成語音特征譜。二,在低信噪比的情況下,缺失數(shù)據(jù)特征的方法在提取特征時(shí),有一些語音的場景,被估計(jì)出的可靠部分很少,不可靠部分很多。這種語音幀的不可靠部分全部由補(bǔ)償?shù)闹荡妫纱斯烙?jì)出的特征譜的魯棒性較差。本發(fā)明解決了這兩個(gè)問題。