一種目標聲源鎖定和提取的方法

基本信息

申請?zhí)?/td> 2020110420090 申請日 -
公開(公告)號 CN112259117A 公開(公告)日 2021-01-22
申請公布號 CN112259117A 申請公布日 2021-01-22
分類號 G10L21/0272(2013.01)I; 分類 樂器;聲學;
發(fā)明人 葉劍豪;瞿虎林;周偉林 申請(專利權(quán))人 上海聲瀚信息科技有限公司
代理機構(gòu) 北京化育知識產(chǎn)權(quán)代理有限公司 代理人 尹均利
地址 200120上海市浦東新區(qū)中國(上海)自由貿(mào)易試驗區(qū)納賢路800號1幢A座608室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種目標聲源鎖定和提取的方法,首先通過多通道BSS算法AUX?IVA(基于輔助函數(shù)的獨立向量分析)提取出多個聲源,再通過基于SNR(信噪比)和語音識別系統(tǒng)反饋的自適應目標聲源鎖定進行聲源選擇。在此基礎(chǔ)上,再通過聲源分離中的不同聲源相對的空間信息判斷純干擾聲源段,并進行消除。最后使用基于DNN的VAD端點檢測。算法提取最終的目標聲源有效語音段,語音識別系統(tǒng)的反饋同樣作用于VAD算法?;跁r間窗的AUX?IVA算法,總體算法收斂迭代次數(shù)所需少,更加輕量級,且進一步利用空間信息進行干擾源和目標源的分離提取。??