一種基于UNET結(jié)構(gòu)利用傳聲器陣列語(yǔ)音源定位方法

基本信息

申請(qǐng)?zhí)?/td> 2020110965745 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112269158A 公開(kāi)(公告)日 2021-01-26
申請(qǐng)公布號(hào) CN112269158A 申請(qǐng)公布日 2021-01-26
分類號(hào) G01S3/80(2006.01)I; 分類 測(cè)量;測(cè)試;
發(fā)明人 王浩;盧晶;劉曉峻;狄敏;姚志強(qiáng) 申請(qǐng)(專利權(quán))人 江蘇南大電子信息技術(shù)股份有限公司
代理機(jī)構(gòu) 南京瑞弘專利商標(biāo)事務(wù)所(普通合伙) 代理人 彭雄
地址 210019江蘇省南京市建鄴區(qū)白龍江東街8號(hào)科技綜合A區(qū)1幢14層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于UNET結(jié)構(gòu)利用傳聲器陣列語(yǔ)音源定位方法,步驟如下:(1)生成訓(xùn)練樣本,得到時(shí)?頻域信號(hào),并獲得功率包絡(luò);(2)對(duì)時(shí)?頻域信號(hào)的每個(gè)時(shí)?頻點(diǎn),計(jì)算對(duì)應(yīng)的語(yǔ)音能量占比和直達(dá)路徑語(yǔ)音能量占比;(3)利用步驟(1)生成的樣本訓(xùn)練多任務(wù)UNET結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò);(4)利用已訓(xùn)練的多任務(wù)UNET結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)待測(cè)含噪信號(hào)每個(gè)時(shí)?頻點(diǎn)語(yǔ)音直達(dá)聲能量占比;(5)對(duì)判斷語(yǔ)音直達(dá)聲能量占比較高的時(shí)?頻點(diǎn),應(yīng)用定位方法,得到定位結(jié)果。本發(fā)明的語(yǔ)音聲源定位方法,能夠使得在高混響及高干擾的環(huán)境中,有效去除干擾和混響的影響,獲得精確度和魯棒性較高的結(jié)果。??