一種目標(biāo)聲源鎖定和提取的方法
基本信息
申請(qǐng)?zhí)?/td> | 2020110420090 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112259117A | 公開(公告)日 | 2021-01-22 |
申請(qǐng)公布號(hào) | CN112259117A | 申請(qǐng)公布日 | 2021-01-22 |
分類號(hào) | G10L21/0272(2013.01)I; | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 葉劍豪;瞿虎林;周偉林 | 申請(qǐng)(專利權(quán))人 | 上海聲瀚信息科技有限公司 |
代理機(jī)構(gòu) | 北京化育知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 尹均利 |
地址 | 200120上海市浦東新區(qū)中國(guó)(上海)自由貿(mào)易試驗(yàn)區(qū)納賢路800號(hào)1幢A座608室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種目標(biāo)聲源鎖定和提取的方法,首先通過多通道BSS算法AUX?IVA(基于輔助函數(shù)的獨(dú)立向量分析)提取出多個(gè)聲源,再通過基于SNR(信噪比)和語音識(shí)別系統(tǒng)反饋的自適應(yīng)目標(biāo)聲源鎖定進(jìn)行聲源選擇。在此基礎(chǔ)上,再通過聲源分離中的不同聲源相對(duì)的空間信息判斷純干擾聲源段,并進(jìn)行消除。最后使用基于DNN的VAD端點(diǎn)檢測(cè)。算法提取最終的目標(biāo)聲源有效語音段,語音識(shí)別系統(tǒng)的反饋同樣作用于VAD算法?;跁r(shí)間窗的AUX?IVA算法,總體算法收斂迭代次數(shù)所需少,更加輕量級(jí),且進(jìn)一步利用空間信息進(jìn)行干擾源和目標(biāo)源的分離提取。?? |
