一種用于對麥克風(fēng)陣列拾取的語音信號進(jìn)行聲源分離的方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201810648958.X 申請日 -
公開(公告)號 CN108735227A 公開(公告)日 2018-11-02
申請公布號 CN108735227A 申請公布日 2018-11-02
分類號 G10L21/0208;G10L21/0216;G10L21/028 分類 樂器;聲學(xué);
發(fā)明人 代金良;景源 申請(專利權(quán))人 北京三聽科技有限公司
代理機(jī)構(gòu) 北京名華博信知識產(chǎn)權(quán)代理有限公司 代理人 北京三聽科技有限公司
地址 100176 北京市大興區(qū)北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)榮昌東街5號3號樓8層KC015(集中辦公區(qū))
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種用于對麥克風(fēng)陣列拾取的語音信號進(jìn)行聲源分離的方法和系統(tǒng)。該方法包括:接收語音信號,并檢測語音信號中的聲源數(shù)量n;判斷n是否大于1,若n>1,則計算各聲源的波達(dá)方向角度值;將波達(dá)方向角度值按照大小順序排序,并計算相鄰兩個波達(dá)方向角度值之差;判斷所有角度間隔是否均大于或等于設(shè)定角度間隔閾值C,若是,則執(zhí)行下一步,若否,則修正兩個或多個波達(dá)方向角度值,并執(zhí)行下一步;基于波達(dá)方向角度值和/或修正后的波達(dá)方向角度值對語音信號進(jìn)行波束形成得到n個增強(qiáng)語音信號,并對n個增強(qiáng)語音信號執(zhí)行盲源分離算法,得到相應(yīng)于n個聲源的n個分離的語音信號。該方法和系統(tǒng)以獲得更優(yōu)的聲源分離性能。