一種實時處理的二維聲源定位方法
基本信息
申請?zhí)?/td> | CN202010541028.1 | 申請日 | - |
公開(公告)號 | CN111650559A | 公開(公告)日 | 2020-09-11 |
申請公布號 | CN111650559A | 申請公布日 | 2020-09-11 |
分類號 | G01S5/20(2006.01)I | 分類 | 測量;測試; |
發(fā)明人 | 詹五洲 | 申請(專利權(quán))人 | 深圳市裂石影音科技有限公司 |
代理機構(gòu) | 深圳市中科創(chuàng)為專利代理有限公司 | 代理人 | 深圳市裂石影音科技有限公司 |
地址 | 518000廣東省深圳市南山區(qū)桃源街道平山社區(qū)麗山路10號大學(xué)城創(chuàng)業(yè)園705室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種實時處理的二維聲源定位方法,包括如下步驟:將麥克風(fēng)陣列采集的音頻數(shù)據(jù)寫入DDR,對NIS幀前導(dǎo)噪聲段做FFT運算,得出各幀的短時譜熵;對每一短時譜熵進行平滑濾波處理,計算處每一短時譜熵的最小值和均值,再以此計算得到閥值T1和閥值T2;判定各幀是有話幀或噪聲,若為噪聲,則輸出結(jié)果為isSpeech標(biāo)志為0,并返回azimuth角和elevation角都為0;若為有話幀,則進入下一步驟;通過改進SRP?PHAT算法,分兩步進行聲源定位,分別計算出azimuth角和elevation角;最后輸出isSpeech標(biāo)志為1,聲源定位為(azimuth,elevation)為(,θDOA)。本發(fā)明技術(shù)方案結(jié)合VAD算法和改進SRP?PHAT算法的策略,并且采取azimuth角和elevation角分步定位的方法來解決二維聲源定位的精度、穩(wěn)定性和計算量的問題。?? |
