一種極短語音語種識別特征提取方法
基本信息
申請?zhí)?/td> | CN202110755053.4 | 申請日 | - |
公開(公告)號 | CN113380226A | 公開(公告)日 | 2021-09-10 |
申請公布號 | CN113380226A | 申請公布日 | 2021-09-10 |
分類號 | G10L15/00(2013.01)I;G10L15/20(2006.01)I;G10L25/03(2013.01)I;G10L25/18(2013.01)I | 分類 | 樂器;聲學; |
發(fā)明人 | 劉俊南;郭鵬;江海;魏欣;齊心 | 申請(專利權)人 | 因諾微科技(天津)有限公司 |
代理機構 | 天津諾德知識產權代理事務所(特殊普通合伙) | 代理人 | 朱卉 |
地址 | 300000天津市濱海新區(qū)華苑產業(yè)區(qū)(環(huán)外)海泰發(fā)展五道16號B-6號樓-1-502 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種極短語音語種識別特征提取方法,所述方法包括步驟:獲取輸入語音信號;對所述輸入語音信號進行預處理;獲取基于線性預測系數(shù)算法;使用所述基于線性預測系數(shù)算法對所述輸入語音信號進行特征提取。本申請針對時長1s的極短語音提取語種識別特征進行研究,設計對極短(1s長度)語音語種識別更加魯棒的特征提取方法,該特征利用頻域線性預測系數(shù)(FDLP)方法,先使用離散余弦變換(Discrete Cosine Transform,DCT)獲得信號的頻域等價物,再在頻域等價物上利用線性預測(Linear Prediction,LP)分析計算得到語音信號的子帶包絡信號(Sub?band Envelop Signal),然后將子帶包絡信號經過傅里葉變換轉化為子帶包絡的頻域信號,然后計算子帶包絡幅度特征。 |
