一種基于圖卷積神經(jīng)網(wǎng)絡(luò)的語(yǔ)音關(guān)鍵詞識(shí)別系統(tǒng)及方法
基本信息
申請(qǐng)?zhí)?/td> | CN202011057897.3 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112435652A | 公開(kāi)(公告)日 | 2021-03-02 |
申請(qǐng)公布號(hào) | CN112435652A | 申請(qǐng)公布日 | 2021-03-02 |
分類號(hào) | G10L15/02(2006.01)I;G10L15/22(2006.01)I;G06N3/04(2006.01)I;G06K9/62(2006.01)I;G06K9/40(2006.01)I;G10L15/08(2006.01)I;G06N3/08(2006.01)I | 分類 | 樂(lè)器;聲學(xué); |
發(fā)明人 | 陳曦;宋丹丹;歐陽(yáng)鵬;尹首一 | 申請(qǐng)(專利權(quán))人 | 江蘇清微智能科技有限公司 |
代理機(jī)構(gòu) | 北京索睿邦知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 李根 |
地址 | 211100江蘇省南京市江寧區(qū)麒麟科技創(chuàng)新園創(chuàng)研路266號(hào)人工智能產(chǎn)業(yè)園8號(hào)樓3層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)一種基于圖卷積神經(jīng)網(wǎng)絡(luò)的語(yǔ)音關(guān)鍵詞識(shí)別系統(tǒng)及方法,屬于神經(jīng)網(wǎng)絡(luò)的輕量級(jí)、低功耗的語(yǔ)音關(guān)鍵詞識(shí)別方法技術(shù)領(lǐng)域。包括:一個(gè)語(yǔ)音數(shù)據(jù)采集模塊、一個(gè)帶通濾波器、一個(gè)聲學(xué)特征提取模塊、一個(gè)神經(jīng)網(wǎng)絡(luò)分類器和一個(gè)基礎(chǔ)網(wǎng)絡(luò)結(jié)構(gòu)。基于圖卷積神經(jīng)網(wǎng)絡(luò)的語(yǔ)音關(guān)鍵詞識(shí)別系統(tǒng)使用窄通道的bottleneck結(jié)構(gòu)和殘差連接的方式,在精度相當(dāng)?shù)那闆r下顯著壓縮了網(wǎng)絡(luò)的復(fù)雜度,實(shí)現(xiàn)了高效的網(wǎng)絡(luò)計(jì)算,更適用于低資源設(shè)備場(chǎng)景的應(yīng)用。引入圖卷積網(wǎng)絡(luò)對(duì)卷積特征圖全局上下文進(jìn)行建模,提高了語(yǔ)音關(guān)鍵詞識(shí)別準(zhǔn)確率。本發(fā)明解決了現(xiàn)有技術(shù)中基于卷積神經(jīng)網(wǎng)絡(luò)的關(guān)鍵詞識(shí)別方法網(wǎng)絡(luò)復(fù)雜度還比較高和計(jì)算仍然比較密集和卷積神經(jīng)網(wǎng)絡(luò)難以提取全局信息的問(wèn)題。?? |
