一種人聲識別算法
基本信息
申請?zhí)?/td> | CN201910272975.2 | 申請日 | - |
公開(公告)號 | CN110033757A | 公開(公告)日 | 2019-07-19 |
申請公布號 | CN110033757A | 申請公布日 | 2019-07-19 |
分類號 | G10L15/02;G10L15/16;G10L21/0208 | 分類 | 樂器;聲學; |
發(fā)明人 | 史程;彭加木 | 申請(專利權)人 | 行知技術有限公司 |
代理機構 | 南京常青藤知識產權代理有限公司 | 代理人 | 行知技術有限公司;李東明 |
地址 | 210000 江蘇省南京市江寧區(qū)秣陵街道秣周東路12號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種人聲識別算法,包括以下步驟:S1:對說話人聲音音量大小的自適應處理,將說話人的聲音音量大小進行識別模型訓練后做總體歸一化處理到相同的最大值;S2:對說話人聲音靜音區(qū)的自適應處理,通過均值濾波判斷出當前說話人的音量數(shù)值大小,再通過閾值過濾掉靜音的區(qū)域;S3:對背景音濾波降噪,并對說話人聲音數(shù)據做一致性處理;S4:提取說話人的聲音特征,通過訓練好的神經網絡算法模型,提取說話人聲音的高維特征向量;S5:對說話人的聲音特征與聲紋庫進行比對識別,利用余弦距離比對神經網絡算法模型提取的高維特征,獲取說話人特征的相似度。本發(fā)明對說話人的聲音特征進行直接辨識,噪聲小,算法精度高。 |
