一種基于深度學(xué)習(xí)特征連接分析的語音事件提取方法

基本信息

申請?zhí)?/td> CN202111071902.0 申請日 -
公開(公告)號 CN113963228A 公開(公告)日 2022-01-21
申請公布號 CN113963228A 申請公布日 2022-01-21
分類號 G06V10/774(2022.01)I;G06V10/82(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王珂;王圣川;景亮;蔣波;郭耀川 申請(專利權(quán))人 電信科學(xué)技術(shù)第五研究所有限公司
代理機構(gòu) 成都九鼎天元知識產(chǎn)權(quán)代理有限公司 代理人 徐靜
地址 610021四川省成都市錦江區(qū)大慈寺路22號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于深度學(xué)習(xí)特征連接分析的語音事件提取方法,包括:對用于訓(xùn)練的語音信號文件進行預(yù)處理得到訓(xùn)練語圖樣本文件以及樣本標(biāo)簽,并制作成訓(xùn)練數(shù)據(jù)集;采用訓(xùn)練數(shù)據(jù)集訓(xùn)練深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)模型;對待預(yù)測語音信號文件進行預(yù)處理得到包含若干待預(yù)測語圖樣本文件的待預(yù)測數(shù)據(jù)集;將待預(yù)測數(shù)據(jù)集輸入訓(xùn)練好的深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)模型進行預(yù)測,并將預(yù)測結(jié)果拼接為一組特征向量;對特征向量進行特征處理,特征向量中的特征值大于設(shè)定閾值即語音事件的位置信息,根據(jù)語音事件的位置信息從待預(yù)測語音信號文件中提取語音事件。本發(fā)明能夠在語音信號較弱的情況下依然能夠進行識別并提取,并且用特征向量的方式來表達語音信號,其精度高。