一種基于二值殘差神經(jīng)網(wǎng)絡(luò)的語音喚醒方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202210631715.1 申請日 -
公開(公告)號 CN114708855A 公開(公告)日 2022-07-05
申請公布號 CN114708855A 申請公布日 2022-07-05
分類號 G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/16(2006.01)I;G10L15/22(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 樂器;聲學;
發(fā)明人 王嘯;尚德龍;周玉梅 申請(專利權(quán))人 中科南京智能技術(shù)研究院
代理機構(gòu) 北京高沃律師事務(wù)所 代理人 -
地址 211100江蘇省南京市江寧區(qū)創(chuàng)研路266號麒麟人工智能產(chǎn)業(yè)園1號樓5層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于二值殘差神經(jīng)網(wǎng)絡(luò)的語音喚醒方法及系統(tǒng),涉及語音喚醒技術(shù)領(lǐng)域。所述方法包括:獲取待識別音頻文件,得到待處理語音信號;對所述待處理語音信號進行特征提取,得到梅爾頻譜特征幀;構(gòu)建二值殘差神經(jīng)網(wǎng)絡(luò)模型;將所述梅爾頻譜特征幀輸入至訓練好的二值殘差神經(jīng)網(wǎng)絡(luò)模型中,得到關(guān)鍵詞以及非關(guān)鍵詞的概率值;根據(jù)所述概率值判斷是否進行語音喚醒。本發(fā)明能夠在減少數(shù)據(jù)存儲量與計算量的同時提高語音喚醒的識別準確度。