一種單聲道語(yǔ)音關(guān)鍵詞低功耗實(shí)時(shí)檢測(cè)方法
基本信息
申請(qǐng)?zhí)?/td> | CN202010672476.5 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN111862957A | 公開(kāi)(公告)日 | 2020-10-30 |
申請(qǐng)公布號(hào) | CN111862957A | 申請(qǐng)公布日 | 2020-10-30 |
分類號(hào) | G10L15/08(2006.01)I | 分類 | 樂(lè)器;聲學(xué); |
發(fā)明人 | 付志勇;姜黎;胡奎;王蒙 | 申請(qǐng)(專利權(quán))人 | 杭州芯聲智能科技有限公司 |
代理機(jī)構(gòu) | 廣州凱東知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 杭州芯聲智能科技有限公司 |
地址 | 310000浙江省杭州市經(jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū)白楊街道科技園路20號(hào)14幢3層02室-15 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種單聲道語(yǔ)音關(guān)鍵詞低功耗實(shí)時(shí)檢測(cè)方法,包括以下步驟:預(yù)處理;提取歸一化通道能量特征;得到卷積神經(jīng)網(wǎng)絡(luò)層的輸出;使用一層門控循環(huán)單元神經(jīng)元,對(duì)卷積神經(jīng)網(wǎng)絡(luò)層的輸出特征結(jié)合歷史狀態(tài)進(jìn)行記憶、更新和重置,最終得到當(dāng)前幀的新?tīng)顟B(tài);門控循環(huán)單元的狀態(tài)經(jīng)過(guò)注意力機(jī)制層的變換得出一個(gè)重要性權(quán)重,與門控循環(huán)單元當(dāng)前幀的狀態(tài)做內(nèi)積后,得到最終的預(yù)測(cè)概率值;判斷是否連續(xù)m幀預(yù)測(cè)概率值大于n,如是,則判定檢測(cè)到關(guān)鍵詞,反之則判定沒(méi)有檢測(cè)到關(guān)鍵詞。具有計(jì)算量大大降低、檢測(cè)效率和精度更高的優(yōu)點(diǎn)。?? |
