一種基于前饋記憶網(wǎng)絡(luò)的多通道防串音動態(tài)規(guī)劃策略

基本信息

申請?zhí)?/td> CN202111654488.6 申請日 -
公開(公告)號 CN114566150A 公開(公告)日 2022-05-31
申請公布號 CN114566150A 申請公布日 2022-05-31
分類號 G10L15/02(2006.01)I;G10L15/16(2006.01)I;G10L15/20(2006.01)I;G10L15/22(2006.01)I;G10L15/26(2006.01)I;G10L15/28(2013.01)I;G10L21/0208(2013.01)I;H04R1/08(2006.01)I;H04R3/04(2006.01)I 分類 樂器;聲學(xué);
發(fā)明人 麥聯(lián)韜;唐海江;朱宇;袁宇豪 申請(專利權(quán))人 杭州云嘉云計算有限公司
代理機構(gòu) 杭州杭誠專利事務(wù)所有限公司 代理人 -
地址 311100浙江省杭州市余杭區(qū)五常街道聯(lián)創(chuàng)街188號5號樓401室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于前饋記憶網(wǎng)絡(luò)的多通道防串音動態(tài)規(guī)劃策略,具體包括以下步驟:步驟S1:采集音源信息;步驟S2:自適應(yīng)音源增益;步驟S3:串音過濾過程;步驟S4:輸出處理后的聲音,獲得多通道識別結(jié)果;本發(fā)明提供的自適應(yīng)音源增益過程不受限于具體現(xiàn)場環(huán)境結(jié)構(gòu)、硬件采音設(shè)備和發(fā)言人的行為,能實時動態(tài)地對發(fā)言人的聲學(xué)信號進行有助于提升識別效果的音源增益,從而避免傳統(tǒng)方法的調(diào)優(yōu)成本,保障實錄過程;通過有效的聲學(xué)特征提取和串音辨識策略模型,實時識別和過濾串音通道,顯著降低了串音現(xiàn)象的發(fā)生;對較為極端的現(xiàn)場環(huán)境,本發(fā)明提供的調(diào)整參數(shù)簡單易用,能快速及時地作出針對性調(diào)整,提升實錄效果。