一種基于二值殘差神經(jīng)網(wǎng)絡(luò)的語音喚醒方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN202210631715.1 | 申請日 | - |
公開(公告)號 | CN114708855A | 公開(公告)日 | 2022-07-05 |
申請公布號 | CN114708855A | 申請公布日 | 2022-07-05 |
分類號 | G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/16(2006.01)I;G10L15/22(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 樂器;聲學; |
發(fā)明人 | 王嘯;尚德龍;周玉梅 | 申請(專利權(quán))人 | 中科南京智能技術(shù)研究院 |
代理機構(gòu) | 北京高沃律師事務(wù)所 | 代理人 | - |
地址 | 211100江蘇省南京市江寧區(qū)創(chuàng)研路266號麒麟人工智能產(chǎn)業(yè)園1號樓5層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于二值殘差神經(jīng)網(wǎng)絡(luò)的語音喚醒方法及系統(tǒng),涉及語音喚醒技術(shù)領(lǐng)域。所述方法包括:獲取待識別音頻文件,得到待處理語音信號;對所述待處理語音信號進行特征提取,得到梅爾頻譜特征幀;構(gòu)建二值殘差神經(jīng)網(wǎng)絡(luò)模型;將所述梅爾頻譜特征幀輸入至訓練好的二值殘差神經(jīng)網(wǎng)絡(luò)模型中,得到關(guān)鍵詞以及非關(guān)鍵詞的概率值;根據(jù)所述概率值判斷是否進行語音喚醒。本發(fā)明能夠在減少數(shù)據(jù)存儲量與計算量的同時提高語音喚醒的識別準確度。 |
