一種基于綜合特征集的深度學習語音增強方法
基本信息
申請?zhí)?/td> | CN201810267142.2 | 申請日 | - |
公開(公告)號 | CN108447495B | 公開(公告)日 | 2020-06-09 |
申請公布號 | CN108447495B | 申請公布日 | 2020-06-09 |
分類號 | G10L21/02;G10L21/0208;G10L25/24;G10L13/02 | 分類 | 樂器;聲學; |
發(fā)明人 | 張濤;任相贏;劉陽 | 申請(專利權)人 | 廊坊市華之邦科技服務有限公司 |
代理機構 | 天津市北洋有限責任專利代理事務所 | 代理人 | 杜文茹 |
地址 | 300072 天津市南開區(qū)衛(wèi)津路92號 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種基于綜合特征集的深度學習語音增強方法:對音頻PCM編碼信號預處理:對音頻PCM編碼信號進行分幀、加窗,同時按照設定比例將原始數(shù)據(jù)集分為訓練集和測試集;利用訓練集對DBN的權重和偏置參數(shù)進行預訓練和微調(diào);利用訓練好的DBN權重和偏置參數(shù)提取DBN聲學特征;從訓練集和測試集中提取互補特征集聲學特征;從DBN聲學特征和互補特征集的特征中選取所需特征;從五種特征匯總成的總向量中提取綜合特征集聲學特征;進行語音增強。本發(fā)明的綜合特征集聲學特征用于語音增強模型噪聲抑制后,信噪比語音評價指標得到了較大提升,所以在極低信噪比條件下本發(fā)明表現(xiàn)出了非常好的優(yōu)勢。 |
