一種目標(biāo)聲源鎖定和提取的方法

基本信息

申請(qǐng)?zhí)?/td> 2020110420090 申請(qǐng)日 -
公開(公告)號(hào) CN112259117A 公開(公告)日 2021-01-22
申請(qǐng)公布號(hào) CN112259117A 申請(qǐng)公布日 2021-01-22
分類號(hào) G10L21/0272(2013.01)I; 分類 樂器;聲學(xué);
發(fā)明人 葉劍豪;瞿虎林;周偉林 申請(qǐng)(專利權(quán))人 上海聲瀚信息科技有限公司
代理機(jī)構(gòu) 北京化育知識(shí)產(chǎn)權(quán)代理有限公司 代理人 尹均利
地址 200120上海市浦東新區(qū)中國(guó)(上海)自由貿(mào)易試驗(yàn)區(qū)納賢路800號(hào)1幢A座608室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種目標(biāo)聲源鎖定和提取的方法,首先通過多通道BSS算法AUX?IVA(基于輔助函數(shù)的獨(dú)立向量分析)提取出多個(gè)聲源,再通過基于SNR(信噪比)和語音識(shí)別系統(tǒng)反饋的自適應(yīng)目標(biāo)聲源鎖定進(jìn)行聲源選擇。在此基礎(chǔ)上,再通過聲源分離中的不同聲源相對(duì)的空間信息判斷純干擾聲源段,并進(jìn)行消除。最后使用基于DNN的VAD端點(diǎn)檢測(cè)。算法提取最終的目標(biāo)聲源有效語音段,語音識(shí)別系統(tǒng)的反饋同樣作用于VAD算法?;跁r(shí)間窗的AUX?IVA算法,總體算法收斂迭代次數(shù)所需少,更加輕量級(jí),且進(jìn)一步利用空間信息進(jìn)行干擾源和目標(biāo)源的分離提取。??