一種目標聲源鎖定和提取的方法
基本信息
申請?zhí)?/td> | 2020110420090 | 申請日 | - |
公開(公告)號 | CN112259117A | 公開(公告)日 | 2021-01-22 |
申請公布號 | CN112259117A | 申請公布日 | 2021-01-22 |
分類號 | G10L21/0272(2013.01)I; | 分類 | 樂器;聲學; |
發(fā)明人 | 葉劍豪;瞿虎林;周偉林 | 申請(專利權(quán))人 | 上海聲瀚信息科技有限公司 |
代理機構(gòu) | 北京化育知識產(chǎn)權(quán)代理有限公司 | 代理人 | 尹均利 |
地址 | 200120上海市浦東新區(qū)中國(上海)自由貿(mào)易試驗區(qū)納賢路800號1幢A座608室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種目標聲源鎖定和提取的方法,首先通過多通道BSS算法AUX?IVA(基于輔助函數(shù)的獨立向量分析)提取出多個聲源,再通過基于SNR(信噪比)和語音識別系統(tǒng)反饋的自適應目標聲源鎖定進行聲源選擇。在此基礎(chǔ)上,再通過聲源分離中的不同聲源相對的空間信息判斷純干擾聲源段,并進行消除。最后使用基于DNN的VAD端點檢測。算法提取最終的目標聲源有效語音段,語音識別系統(tǒng)的反饋同樣作用于VAD算法?;跁r間窗的AUX?IVA算法,總體算法收斂迭代次數(shù)所需少,更加輕量級,且進一步利用空間信息進行干擾源和目標源的分離提取。?? |
