一種基于人工智能的聲紋特征提取方法及裝置
基本信息
申請?zhí)?/td> | CN202110267332.6 | 申請日 | - |
公開(公告)號 | CN112786059A | 公開(公告)日 | 2021-05-11 |
申請公布號 | CN112786059A | 申請公布日 | 2021-05-11 |
分類號 | G10L17/04;G10L17/18;G10L17/02 | 分類 | 樂器;聲學; |
發(fā)明人 | 徐瓊;程鋮;謝根;汪貴旗;聶亞子 | 申請(專利權)人 | 合肥市清大創(chuàng)新研究院有限公司 |
代理機構 | 上海精晟知識產權代理有限公司 | 代理人 | 李佼佼 |
地址 | 230000 安徽省合肥市合肥高新技術開發(fā)區(qū)創(chuàng)新大道2800號創(chuàng)新產業(yè)園二期J2區(qū)C座2318室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于人工智能的聲紋特征提取方法及裝置。本發(fā)明包括如下步驟:采集語音數據和非語音數據,建立樣本數據庫;從樣本數據庫中取一音頻文件,進行處理得到音頻幀序列;對音頻幀序列中每一幀進行傅里葉變化,得到該幀對應的頻譜圖信息;將時域信息和頻域信息進行提取,得到時域特征和頻域特征;將時域特征和頻域特征進行特征聚合,得到聚合后的特征;對聚合后的特征進行向量嵌入,得到聲紋特征向量;將聲紋特征向量輸入至卷積神經網絡模型進行訓練,得到聲紋特征模型;獲取待識別語音數據進行預處理;從預處理后的語音特征數據輸入聲紋特征模型得到語音特征向量。本發(fā)明提高了聲紋特征提取的準確率和效率。 |
