一種基于UNET結(jié)構(gòu)利用傳聲器陣列語(yǔ)音源定位方法
基本信息
申請(qǐng)?zhí)?/td> | 2020110965745 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112269158A | 公開(kāi)(公告)日 | 2021-01-26 |
申請(qǐng)公布號(hào) | CN112269158A | 申請(qǐng)公布日 | 2021-01-26 |
分類號(hào) | G01S3/80(2006.01)I; | 分類 | 測(cè)量;測(cè)試; |
發(fā)明人 | 王浩;盧晶;劉曉峻;狄敏;姚志強(qiáng) | 申請(qǐng)(專利權(quán))人 | 江蘇南大電子信息技術(shù)股份有限公司 |
代理機(jī)構(gòu) | 南京瑞弘專利商標(biāo)事務(wù)所(普通合伙) | 代理人 | 彭雄 |
地址 | 210019江蘇省南京市建鄴區(qū)白龍江東街8號(hào)科技綜合A區(qū)1幢14層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于UNET結(jié)構(gòu)利用傳聲器陣列語(yǔ)音源定位方法,步驟如下:(1)生成訓(xùn)練樣本,得到時(shí)?頻域信號(hào),并獲得功率包絡(luò);(2)對(duì)時(shí)?頻域信號(hào)的每個(gè)時(shí)?頻點(diǎn),計(jì)算對(duì)應(yīng)的語(yǔ)音能量占比和直達(dá)路徑語(yǔ)音能量占比;(3)利用步驟(1)生成的樣本訓(xùn)練多任務(wù)UNET結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò);(4)利用已訓(xùn)練的多任務(wù)UNET結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)待測(cè)含噪信號(hào)每個(gè)時(shí)?頻點(diǎn)語(yǔ)音直達(dá)聲能量占比;(5)對(duì)判斷語(yǔ)音直達(dá)聲能量占比較高的時(shí)?頻點(diǎn),應(yīng)用定位方法,得到定位結(jié)果。本發(fā)明的語(yǔ)音聲源定位方法,能夠使得在高混響及高干擾的環(huán)境中,有效去除干擾和混響的影響,獲得精確度和魯棒性較高的結(jié)果。?? |
