一種基于前饋記憶網(wǎng)絡(luò)的多通道防串音動態(tài)規(guī)劃策略
基本信息
申請?zhí)?/td> | CN202111654488.6 | 申請日 | - |
公開(公告)號 | CN114566150A | 公開(公告)日 | 2022-05-31 |
申請公布號 | CN114566150A | 申請公布日 | 2022-05-31 |
分類號 | G10L15/02(2006.01)I;G10L15/16(2006.01)I;G10L15/20(2006.01)I;G10L15/22(2006.01)I;G10L15/26(2006.01)I;G10L15/28(2013.01)I;G10L21/0208(2013.01)I;H04R1/08(2006.01)I;H04R3/04(2006.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 麥聯(lián)韜;唐海江;朱宇;袁宇豪 | 申請(專利權(quán))人 | 杭州云嘉云計算有限公司 |
代理機構(gòu) | 杭州杭誠專利事務(wù)所有限公司 | 代理人 | - |
地址 | 311100浙江省杭州市余杭區(qū)五常街道聯(lián)創(chuàng)街188號5號樓401室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于前饋記憶網(wǎng)絡(luò)的多通道防串音動態(tài)規(guī)劃策略,具體包括以下步驟:步驟S1:采集音源信息;步驟S2:自適應(yīng)音源增益;步驟S3:串音過濾過程;步驟S4:輸出處理后的聲音,獲得多通道識別結(jié)果;本發(fā)明提供的自適應(yīng)音源增益過程不受限于具體現(xiàn)場環(huán)境結(jié)構(gòu)、硬件采音設(shè)備和發(fā)言人的行為,能實時動態(tài)地對發(fā)言人的聲學(xué)信號進行有助于提升識別效果的音源增益,從而避免傳統(tǒng)方法的調(diào)優(yōu)成本,保障實錄過程;通過有效的聲學(xué)特征提取和串音辨識策略模型,實時識別和過濾串音通道,顯著降低了串音現(xiàn)象的發(fā)生;對較為極端的現(xiàn)場環(huán)境,本發(fā)明提供的調(diào)整參數(shù)簡單易用,能快速及時地作出針對性調(diào)整,提升實錄效果。 |
