識(shí)別喚醒詞的方法和裝置、介質(zhì)以及設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN201910409621.8 申請(qǐng)日 -
公開(公告)號(hào) CN110047485B 公開(公告)日 2021-09-28
申請(qǐng)公布號(hào) CN110047485B 申請(qǐng)公布日 2021-09-28
分類號(hào) G10L15/22;G10L15/28;G10L15/18;G10L15/20 分類 樂(lè)器;聲學(xué);
發(fā)明人 劉鼎 申請(qǐng)(專利權(quán))人 北京地平線機(jī)器人技術(shù)研發(fā)有限公司
代理機(jī)構(gòu) 北京思源智匯知識(shí)產(chǎn)權(quán)代理有限公司 代理人 毛麗琴
地址 100080 北京市海淀區(qū)中關(guān)村大街1號(hào)3層318
法律狀態(tài) -

摘要

摘要 公開了一種識(shí)別喚醒詞的方法和裝置、介質(zhì)以及設(shè)備。其中的方法包括:獲取語(yǔ)音幀的環(huán)境信息以及獲取所述語(yǔ)音幀的歷史喚醒信息;其中,所述語(yǔ)音幀屬于當(dāng)前語(yǔ)音活動(dòng)段;根據(jù)所述語(yǔ)音幀的環(huán)境信息以及所述語(yǔ)音幀的歷史喚醒信息,從預(yù)先設(shè)置的多個(gè)聲學(xué)識(shí)別模型中選擇至少一個(gè)聲學(xué)識(shí)別模型;將所述語(yǔ)音幀提供給所述至少一個(gè)聲學(xué)識(shí)別模型,經(jīng)由所述至少一個(gè)聲學(xué)識(shí)別模型,獲得所述語(yǔ)音幀的聲學(xué)概率分布;根據(jù)所述當(dāng)前語(yǔ)音活動(dòng)段中的各語(yǔ)音幀的聲學(xué)概率分布,確定所述當(dāng)前語(yǔ)音活動(dòng)段是否為喚醒詞。本公開提供的技術(shù)方案有利于兼顧喚醒率、誤喚醒率以及喚醒資源消耗等指標(biāo)。