一種實時處理的二維聲源定位方法

基本信息

申請?zhí)?/td> CN202010541028.1 申請日 -
公開(公告)號 CN111650559A 公開(公告)日 2020-09-11
申請公布號 CN111650559A 申請公布日 2020-09-11
分類號 G01S5/20(2006.01)I 分類 測量;測試;
發(fā)明人 詹五洲 申請(專利權(quán))人 深圳市裂石影音科技有限公司
代理機構(gòu) 深圳市中科創(chuàng)為專利代理有限公司 代理人 深圳市裂石影音科技有限公司
地址 518000廣東省深圳市南山區(qū)桃源街道平山社區(qū)麗山路10號大學(xué)城創(chuàng)業(yè)園705室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種實時處理的二維聲源定位方法,包括如下步驟:將麥克風(fēng)陣列采集的音頻數(shù)據(jù)寫入DDR,對NIS幀前導(dǎo)噪聲段做FFT運算,得出各幀的短時譜熵;對每一短時譜熵進行平滑濾波處理,計算處每一短時譜熵的最小值和均值,再以此計算得到閥值T1和閥值T2;判定各幀是有話幀或噪聲,若為噪聲,則輸出結(jié)果為isSpeech標(biāo)志為0,并返回azimuth角和elevation角都為0;若為有話幀,則進入下一步驟;通過改進SRP?PHAT算法,分兩步進行聲源定位,分別計算出azimuth角和elevation角;最后輸出isSpeech標(biāo)志為1,聲源定位為(azimuth,elevation)為(,θDOA)。本發(fā)明技術(shù)方案結(jié)合VAD算法和改進SRP?PHAT算法的策略,并且采取azimuth角和elevation角分步定位的方法來解決二維聲源定位的精度、穩(wěn)定性和計算量的問題。??