一種基于深度學(xué)習(xí)分類組合的語音事件提取方法

基本信息

申請?zhí)?/td> CN202111071917.7 申請日 -
公開(公告)號 CN113961676A 公開(公告)日 2022-01-21
申請公布號 CN113961676A 申請公布日 2022-01-21
分類號 G06F16/332(2019.01)I;G06F16/33(2019.01)I;G06F16/338(2019.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06V10/774(2022.01)I;G06V10/82(2022.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王珂;王圣川;景亮;李芝權(quán);李遠(yuǎn)繩 申請(專利權(quán))人 電信科學(xué)技術(shù)第五研究所有限公司
代理機(jī)構(gòu) 成都九鼎天元知識產(chǎn)權(quán)代理有限公司 代理人 徐靜
地址 610021四川省成都市錦江區(qū)大慈寺路22號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于深度學(xué)習(xí)分類組合的語音事件提取方法,包括:對用于訓(xùn)練的語音信號文件進(jìn)行預(yù)處理得到訓(xùn)練語圖樣本文件以及樣本標(biāo)簽,并制作成訓(xùn)練數(shù)據(jù)集;采用訓(xùn)練數(shù)據(jù)集訓(xùn)練深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)模型;對待預(yù)測語音信號文件進(jìn)行預(yù)處理得到若干待預(yù)測語圖樣本文件;將若干待預(yù)測語圖樣本文件輸入訓(xùn)練好的深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測分類,得到若干分類結(jié)果,并將分類結(jié)果拼接為特征向量;對特征向量進(jìn)行連續(xù)性處理,得到語音事件的位置信息,然后根據(jù)語音事件的位置信息從原始的待預(yù)測語音信號文件中提取語音事件。本發(fā)明使用深度學(xué)習(xí)二分類處理以及連續(xù)性算法,能夠在語音信號弱或受干擾時也能有不錯的提取效果。