識(shí)別喚醒詞的方法和裝置、介質(zhì)以及設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN201910409621.8 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN110047485B | 公開(公告)日 | 2021-09-28 |
申請(qǐng)公布號(hào) | CN110047485B | 申請(qǐng)公布日 | 2021-09-28 |
分類號(hào) | G10L15/22;G10L15/28;G10L15/18;G10L15/20 | 分類 | 樂(lè)器;聲學(xué); |
發(fā)明人 | 劉鼎 | 申請(qǐng)(專利權(quán))人 | 北京地平線機(jī)器人技術(shù)研發(fā)有限公司 |
代理機(jī)構(gòu) | 北京思源智匯知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 毛麗琴 |
地址 | 100080 北京市海淀區(qū)中關(guān)村大街1號(hào)3層318 | ||
法律狀態(tài) | - |
摘要
摘要 | 公開了一種識(shí)別喚醒詞的方法和裝置、介質(zhì)以及設(shè)備。其中的方法包括:獲取語(yǔ)音幀的環(huán)境信息以及獲取所述語(yǔ)音幀的歷史喚醒信息;其中,所述語(yǔ)音幀屬于當(dāng)前語(yǔ)音活動(dòng)段;根據(jù)所述語(yǔ)音幀的環(huán)境信息以及所述語(yǔ)音幀的歷史喚醒信息,從預(yù)先設(shè)置的多個(gè)聲學(xué)識(shí)別模型中選擇至少一個(gè)聲學(xué)識(shí)別模型;將所述語(yǔ)音幀提供給所述至少一個(gè)聲學(xué)識(shí)別模型,經(jīng)由所述至少一個(gè)聲學(xué)識(shí)別模型,獲得所述語(yǔ)音幀的聲學(xué)概率分布;根據(jù)所述當(dāng)前語(yǔ)音活動(dòng)段中的各語(yǔ)音幀的聲學(xué)概率分布,確定所述當(dāng)前語(yǔ)音活動(dòng)段是否為喚醒詞。本公開提供的技術(shù)方案有利于兼顧喚醒率、誤喚醒率以及喚醒資源消耗等指標(biāo)。 |
