一種采用感知聽覺場景分析的缺失數(shù)據(jù)特征說話人識別方法
基本信息
申請?zhí)?/td> | CN201610114968.6 | 申請日 | - |
公開(公告)號 | CN106448680A | 公開(公告)日 | 2017-02-22 |
申請公布號 | CN106448680A | 申請公布日 | 2017-02-22 |
分類號 | G10L17/02(2013.01)I;G10L17/20(2013.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 吳迪;陶智;趙鶴鳴;張曉俊;肖仲喆;馮哲 | 申請(專利權(quán))人 | 常熟蘇大低碳應(yīng)用技術(shù)研究院有限公司 |
代理機(jī)構(gòu) | 南京知識律師事務(wù)所 | 代理人 | 汪旭東 |
地址 | 215500 江蘇省蘇州市常熟市東南經(jīng)濟(jì)開發(fā)區(qū)東南大道68號1幢 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明針對現(xiàn)有的缺失數(shù)據(jù)特征方法在低信噪比環(huán)境下魯棒性較差的問題,提出了一種感知聽覺場景分析(Perception?Auditory?Scene?Analysis,PASA)的MDF提取方法,進(jìn)一步提高M(jìn)DF方法的魯棒性。PASA方法解決了兩個(gè)關(guān)鍵問題。一,由oracle掩碼估計(jì)出的可靠語音并不完全正確,特別在低信噪比的情況下,噪聲的隨機(jī)特性導(dǎo)致很多噪聲特征譜被估計(jì)成語音特征譜。二,在低信噪比的情況下,缺失數(shù)據(jù)特征的方法在提取特征時(shí),有一些語音的場景,被估計(jì)出的可靠部分很少,不可靠部分很多。這種語音幀的不可靠部分全部由補(bǔ)償?shù)闹荡妫纱斯烙?jì)出的特征譜的魯棒性較差。本發(fā)明解決了這兩個(gè)問題。 |
