一種基于綜合特征集的深度學習語音增強方法

基本信息

申請?zhí)?/td> CN201810267142.2 申請日 -
公開(公告)號 CN108447495B 公開(公告)日 2020-06-09
申請公布號 CN108447495B 申請公布日 2020-06-09
分類號 G10L21/02;G10L21/0208;G10L25/24;G10L13/02 分類 樂器;聲學;
發(fā)明人 張濤;任相贏;劉陽 申請(專利權)人 廊坊市華之邦科技服務有限公司
代理機構 天津市北洋有限責任專利代理事務所 代理人 杜文茹
地址 300072 天津市南開區(qū)衛(wèi)津路92號
法律狀態(tài) -

摘要

摘要 一種基于綜合特征集的深度學習語音增強方法:對音頻PCM編碼信號預處理:對音頻PCM編碼信號進行分幀、加窗,同時按照設定比例將原始數(shù)據(jù)集分為訓練集和測試集;利用訓練集對DBN的權重和偏置參數(shù)進行預訓練和微調(diào);利用訓練好的DBN權重和偏置參數(shù)提取DBN聲學特征;從訓練集和測試集中提取互補特征集聲學特征;從DBN聲學特征和互補特征集的特征中選取所需特征;從五種特征匯總成的總向量中提取綜合特征集聲學特征;進行語音增強。本發(fā)明的綜合特征集聲學特征用于語音增強模型噪聲抑制后,信噪比語音評價指標得到了較大提升,所以在極低信噪比條件下本發(fā)明表現(xiàn)出了非常好的優(yōu)勢。