一種極短語音語種識別特征提取方法

基本信息

申請?zhí)?/td> CN202110755053.4 申請日 -
公開(公告)號 CN113380226A 公開(公告)日 2021-09-10
申請公布號 CN113380226A 申請公布日 2021-09-10
分類號 G10L15/00(2013.01)I;G10L15/20(2006.01)I;G10L25/03(2013.01)I;G10L25/18(2013.01)I 分類 樂器;聲學;
發(fā)明人 劉俊南;郭鵬;江海;魏欣;齊心 申請(專利權)人 因諾微科技(天津)有限公司
代理機構 天津諾德知識產權代理事務所(特殊普通合伙) 代理人 朱卉
地址 300000天津市濱海新區(qū)華苑產業(yè)區(qū)(環(huán)外)海泰發(fā)展五道16號B-6號樓-1-502
法律狀態(tài) -

摘要

摘要 一種極短語音語種識別特征提取方法,所述方法包括步驟:獲取輸入語音信號;對所述輸入語音信號進行預處理;獲取基于線性預測系數(shù)算法;使用所述基于線性預測系數(shù)算法對所述輸入語音信號進行特征提取。本申請針對時長1s的極短語音提取語種識別特征進行研究,設計對極短(1s長度)語音語種識別更加魯棒的特征提取方法,該特征利用頻域線性預測系數(shù)(FDLP)方法,先使用離散余弦變換(Discrete Cosine Transform,DCT)獲得信號的頻域等價物,再在頻域等價物上利用線性預測(Linear Prediction,LP)分析計算得到語音信號的子帶包絡信號(Sub?band Envelop Signal),然后將子帶包絡信號經過傅里葉變換轉化為子帶包絡的頻域信號,然后計算子帶包絡幅度特征。