一種基于UNET結(jié)構(gòu)利用傳聲器陣列語音源定位方法
基本信息
申請?zhí)?/td> | 2020110965745 | 申請日 | - |
公開(公告)號 | CN112269158A | 公開(公告)日 | 2021-01-26 |
申請公布號 | CN112269158A | 申請公布日 | 2021-01-26 |
分類號 | G01S3/80(2006.01)I; | 分類 | 測量;測試; |
發(fā)明人 | 王浩;盧晶;劉曉峻;狄敏;姚志強 | 申請(專利權(quán))人 | 南京南大電子智慧型服務機器人研究院有限公司 |
代理機構(gòu) | 南京瑞弘專利商標事務所(普通合伙) | 代理人 | 彭雄 |
地址 | 210019江蘇省南京市建鄴區(qū)白龍江東街8號科技綜合A區(qū)1幢14層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于UNET結(jié)構(gòu)利用傳聲器陣列語音源定位方法,步驟如下:(1)生成訓練樣本,得到時?頻域信號,并獲得功率包絡;(2)對時?頻域信號的每個時?頻點,計算對應的語音能量占比和直達路徑語音能量占比;(3)利用步驟(1)生成的樣本訓練多任務UNET結(jié)構(gòu)的神經(jīng)網(wǎng)絡;(4)利用已訓練的多任務UNET結(jié)構(gòu)的神經(jīng)網(wǎng)絡預測待測含噪信號每個時?頻點語音直達聲能量占比;(5)對判斷語音直達聲能量占比較高的時?頻點,應用定位方法,得到定位結(jié)果。本發(fā)明的語音聲源定位方法,能夠使得在高混響及高干擾的環(huán)境中,有效去除干擾和混響的影響,獲得精確度和魯棒性較高的結(jié)果。?? |
