一種基于深度學(xué)習(xí)分類組合的語音事件提取方法
基本信息
申請?zhí)?/td> | CN202111071917.7 | 申請日 | - |
公開(公告)號 | CN113961676A | 公開(公告)日 | 2022-01-21 |
申請公布號 | CN113961676A | 申請公布日 | 2022-01-21 |
分類號 | G06F16/332(2019.01)I;G06F16/33(2019.01)I;G06F16/338(2019.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06V10/774(2022.01)I;G06V10/82(2022.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王珂;王圣川;景亮;李芝權(quán);李遠(yuǎn)繩 | 申請(專利權(quán))人 | 電信科學(xué)技術(shù)第五研究所有限公司 |
代理機(jī)構(gòu) | 成都九鼎天元知識產(chǎn)權(quán)代理有限公司 | 代理人 | 徐靜 |
地址 | 610021四川省成都市錦江區(qū)大慈寺路22號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種基于深度學(xué)習(xí)分類組合的語音事件提取方法,包括:對用于訓(xùn)練的語音信號文件進(jìn)行預(yù)處理得到訓(xùn)練語圖樣本文件以及樣本標(biāo)簽,并制作成訓(xùn)練數(shù)據(jù)集;采用訓(xùn)練數(shù)據(jù)集訓(xùn)練深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)模型;對待預(yù)測語音信號文件進(jìn)行預(yù)處理得到若干待預(yù)測語圖樣本文件;將若干待預(yù)測語圖樣本文件輸入訓(xùn)練好的深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測分類,得到若干分類結(jié)果,并將分類結(jié)果拼接為特征向量;對特征向量進(jìn)行連續(xù)性處理,得到語音事件的位置信息,然后根據(jù)語音事件的位置信息從原始的待預(yù)測語音信號文件中提取語音事件。本發(fā)明使用深度學(xué)習(xí)二分類處理以及連續(xù)性算法,能夠在語音信號弱或受干擾時也能有不錯的提取效果。 |
