語(yǔ)音喚醒方法和裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)、電子設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN202110309200.5 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113053377A | 公開(kāi)(公告)日 | 2021-06-29 |
申請(qǐng)公布號(hào) | CN113053377A | 申請(qǐng)公布日 | 2021-06-29 |
分類(lèi)號(hào) | G10L15/22;G10L15/02;G06F9/4401 | 分類(lèi) | 樂(lè)器;聲學(xué); |
發(fā)明人 | 黃明運(yùn) | 申請(qǐng)(專(zhuān)利權(quán))人 | 南京地平線(xiàn)機(jī)器人技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京思源智匯知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 王曉多 |
地址 | 210046 江蘇省南京市棲霞區(qū)經(jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū)興智科技園A棟20層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本公開(kāi)實(shí)施例公開(kāi)了一種語(yǔ)音喚醒方法和裝置、計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)、電子設(shè)備,其中,方法包括:獲取語(yǔ)音信號(hào),確定所述語(yǔ)音信號(hào)包括的多幀信號(hào)中每幀信號(hào)為至少一個(gè)音素的概率值;其中,每幀所述信號(hào)對(duì)應(yīng)至少一個(gè)音素,每個(gè)所述音素對(duì)應(yīng)一個(gè)概率值;基于所述每個(gè)音素對(duì)應(yīng)的概率值,確定所述語(yǔ)音信號(hào)對(duì)應(yīng)的第一路徑;根據(jù)所述第一路徑中包括的多個(gè)音素與先驗(yàn)條件,確定所述第一路徑是否滿(mǎn)足預(yù)設(shè)條件;若所述第一路徑滿(mǎn)足預(yù)設(shè)條件,根據(jù)所述語(yǔ)音信號(hào)對(duì)待喚醒設(shè)備進(jìn)行喚醒;本公開(kāi)實(shí)施例結(jié)合先驗(yàn)條件對(duì)第一路徑進(jìn)行判斷,增加了判斷策略來(lái)確定是否誤報(bào),在提升關(guān)鍵詞的識(shí)別率的同時(shí)能夠降低語(yǔ)音信號(hào)的誤報(bào)率。 |
