一種陣列語音增強(qiáng)算法
基本信息
申請?zhí)?/td> | CN201811227423.1 | 申請日 | - |
公開(公告)號 | CN109308904A | 公開(公告)日 | 2019-02-05 |
申請公布號 | CN109308904A | 申請公布日 | 2019-02-05 |
分類號 | G10L21/02;G10L15/22;G10L21/0216;G10L21/0224;G10L21/0232 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 蔡洪濱;何昕;陳學(xué)超;顧樑 | 申請(專利權(quán))人 | 上海聲瀚信息科技有限公司 |
代理機(jī)構(gòu) | 上海海貝律師事務(wù)所 | 代理人 | 上海聲瀚信息科技有限公司 |
地址 | 200433 上海市楊浦區(qū)國定路323號1102-72室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種陣列語音增強(qiáng)算法,包括額步驟有S10噪聲估計(jì):通過定義接收到的音頻信號,利用對每個頻帶跟蹤帶噪語音功率的最小值來實(shí)現(xiàn)對該頻帶的噪聲的粗略估計(jì);S20時頻掩蔽估計(jì):通過定義某個時頻點(diǎn)上語音出現(xiàn)的后驗(yàn)概率為當(dāng)前時頻點(diǎn)的掩蔽系數(shù),用于估計(jì)噪聲和語音在語譜圖上存在的概率;S30陣列MVDR權(quán)系數(shù)向量估計(jì):通過定義多路輸入信號每幀的頻域向量,用于估計(jì)目標(biāo)聲源的具體方位,本發(fā)明在最小畸變的條件下最大程度的提升有效語音,使經(jīng)多路增強(qiáng)后的語音信號識別率得到明顯提升,增強(qiáng)語音信號的信噪比,大大增強(qiáng)了語音的可懂度。 |
