一種基于耳腔振動(dòng)的靜默語音采集處理方法及設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202111118423.X 申請(qǐng)日 -
公開(公告)號(hào) CN113810819B 公開(公告)日 2022-06-28
申請(qǐng)公布號(hào) CN113810819B 申請(qǐng)公布日 2022-06-28
分類號(hào) H04R1/10(2006.01)I;G10L15/02(2006.01)I;G10L15/26(2006.01)I;G10L21/0364(2013.01)I 分類 電通信技術(shù);
發(fā)明人 劉杰;蓋鑫;戴國忠;田豐 申請(qǐng)(專利權(quán))人 中國科學(xué)院軟件研究所
代理機(jī)構(gòu) 北京君尚知識(shí)產(chǎn)權(quán)代理有限公司 代理人 -
地址 100190北京市海淀區(qū)中關(guān)村南四街4號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于耳腔振動(dòng)的靜默語音采集處理方法及設(shè)備。本方法為:1)靜默語音采集單元持續(xù)監(jiān)測(cè)佩戴者耳腔的震動(dòng)信號(hào),當(dāng)震動(dòng)信號(hào)的震動(dòng)幅度或頻率變化高于設(shè)定閾值時(shí),該靜默語音采集單元中的空氣振動(dòng)傳感器、骨振動(dòng)傳感器同時(shí)開始進(jìn)行信號(hào)采集,并將采集的信號(hào)發(fā)送到數(shù)據(jù)處理端;2)數(shù)據(jù)處理端接收到信號(hào)后,以設(shè)定時(shí)間長度為基本單位,將采集的連續(xù)語音信號(hào)、震動(dòng)信號(hào)分別劃分為若干幀,并計(jì)算每一幀的平均能量及平均頻率,然后根據(jù)計(jì)算結(jié)果與設(shè)定能量閾值進(jìn)行比較判斷用戶是傳統(tǒng)語音輸入或靜默語音輸入;3)對(duì)于傳統(tǒng)語音輸入,調(diào)用端到端語音識(shí)別模型進(jìn)行語音內(nèi)容識(shí)別;對(duì)于靜默語音輸入,則采用卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)采集到的震動(dòng)信號(hào)進(jìn)行特征提取、融合與內(nèi)容識(shí)別。