一種基于人工智能的聲紋特征提取方法及裝置
基本信息
申請?zhí)?/td> | CN202110267332.6 | 申請日 | - |
公開(公告)號 | CN112786059A | 公開(公告)日 | 2021-05-11 |
申請公布號 | CN112786059A | 申請公布日 | 2021-05-11 |
分類號 | G10L17/04;G10L17/18;G10L17/02 | 分類 | 樂器;聲學; |
發(fā)明人 | 徐瓊;程鋮;謝根;汪貴旗;聶亞子 | 申請(專利權(quán))人 | 合肥市清大創(chuàng)新研究院有限公司 |
代理機構(gòu) | 上海精晟知識產(chǎn)權(quán)代理有限公司 | 代理人 | 李佼佼 |
地址 | 230000 安徽省合肥市合肥高新技術開發(fā)區(qū)創(chuàng)新大道2800號創(chuàng)新產(chǎn)業(yè)園二期J2區(qū)C座2318室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于人工智能的聲紋特征提取方法及裝置。本發(fā)明包括如下步驟:采集語音數(shù)據(jù)和非語音數(shù)據(jù),建立樣本數(shù)據(jù)庫;從樣本數(shù)據(jù)庫中取一音頻文件,進行處理得到音頻幀序列;對音頻幀序列中每一幀進行傅里葉變化,得到該幀對應的頻譜圖信息;將時域信息和頻域信息進行提取,得到時域特征和頻域特征;將時域特征和頻域特征進行特征聚合,得到聚合后的特征;對聚合后的特征進行向量嵌入,得到聲紋特征向量;將聲紋特征向量輸入至卷積神經(jīng)網(wǎng)絡模型進行訓練,得到聲紋特征模型;獲取待識別語音數(shù)據(jù)進行預處理;從預處理后的語音特征數(shù)據(jù)輸入聲紋特征模型得到語音特征向量。本發(fā)明提高了聲紋特征提取的準確率和效率。 |
