一種基于UNET結(jié)構(gòu)利用傳聲器陣列語音源定位方法

基本信息

申請?zhí)?/td> 2020110965745 申請日 -
公開(公告)號 CN112269158A 公開(公告)日 2021-01-26
申請公布號 CN112269158A 申請公布日 2021-01-26
分類號 G01S3/80(2006.01)I; 分類 測量;測試;
發(fā)明人 王浩;盧晶;劉曉峻;狄敏;姚志強 申請(專利權(quán))人 南京南大電子智慧型服務機器人研究院有限公司
代理機構(gòu) 南京瑞弘專利商標事務所(普通合伙) 代理人 彭雄
地址 210019江蘇省南京市建鄴區(qū)白龍江東街8號科技綜合A區(qū)1幢14層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于UNET結(jié)構(gòu)利用傳聲器陣列語音源定位方法,步驟如下:(1)生成訓練樣本,得到時?頻域信號,并獲得功率包絡;(2)對時?頻域信號的每個時?頻點,計算對應的語音能量占比和直達路徑語音能量占比;(3)利用步驟(1)生成的樣本訓練多任務UNET結(jié)構(gòu)的神經(jīng)網(wǎng)絡;(4)利用已訓練的多任務UNET結(jié)構(gòu)的神經(jīng)網(wǎng)絡預測待測含噪信號每個時?頻點語音直達聲能量占比;(5)對判斷語音直達聲能量占比較高的時?頻點,應用定位方法,得到定位結(jié)果。本發(fā)明的語音聲源定位方法,能夠使得在高混響及高干擾的環(huán)境中,有效去除干擾和混響的影響,獲得精確度和魯棒性較高的結(jié)果。??