一種基于深度學(xué)習(xí)特征連接分析的語音事件提取方法
基本信息
申請?zhí)?/td> | CN202111071902.0 | 申請日 | - |
公開(公告)號 | CN113963228A | 公開(公告)日 | 2022-01-21 |
申請公布號 | CN113963228A | 申請公布日 | 2022-01-21 |
分類號 | G06V10/774(2022.01)I;G06V10/82(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王珂;王圣川;景亮;蔣波;郭耀川 | 申請(專利權(quán))人 | 電信科學(xué)技術(shù)第五研究所有限公司 |
代理機構(gòu) | 成都九鼎天元知識產(chǎn)權(quán)代理有限公司 | 代理人 | 徐靜 |
地址 | 610021四川省成都市錦江區(qū)大慈寺路22號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種基于深度學(xué)習(xí)特征連接分析的語音事件提取方法,包括:對用于訓(xùn)練的語音信號文件進行預(yù)處理得到訓(xùn)練語圖樣本文件以及樣本標(biāo)簽,并制作成訓(xùn)練數(shù)據(jù)集;采用訓(xùn)練數(shù)據(jù)集訓(xùn)練深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)模型;對待預(yù)測語音信號文件進行預(yù)處理得到包含若干待預(yù)測語圖樣本文件的待預(yù)測數(shù)據(jù)集;將待預(yù)測數(shù)據(jù)集輸入訓(xùn)練好的深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)模型進行預(yù)測,并將預(yù)測結(jié)果拼接為一組特征向量;對特征向量進行特征處理,特征向量中的特征值大于設(shè)定閾值即語音事件的位置信息,根據(jù)語音事件的位置信息從待預(yù)測語音信號文件中提取語音事件。本發(fā)明能夠在語音信號較弱的情況下依然能夠進行識別并提取,并且用特征向量的方式來表達語音信號,其精度高。 |
