基于語音識別的喚醒實現(xiàn)方法及裝置

基本信息

申請?zhí)?/td> CN202110933173.9 申請日 -
公開(公告)號 CN113658593A 公開(公告)日 2021-11-16
申請公布號 CN113658593A 申請公布日 2021-11-16
分類號 G10L15/22(2006.01)I 分類 樂器;聲學(xué);
發(fā)明人 趙茂祥;李全忠;何國濤;蒲瑤 申請(專利權(quán))人 普強時代(珠海橫琴)信息技術(shù)有限公司
代理機構(gòu) 北京科億知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 湯東鳳
地址 519000廣東省珠海市橫琴新區(qū)寶華路6號105室-58115(集中辦公室)
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于語音識別的喚醒實現(xiàn)方法及裝置,所述方法包括獲取語音數(shù)據(jù)并對所述語音數(shù)據(jù)進行特征提取和前向計算;將計算后的語音數(shù)據(jù)輸入到預(yù)構(gòu)建的喚醒模型中,得到所述喚醒模型中喚醒詞備選項的置信度;將所述置信度與預(yù)設(shè)閾值進行對比,根據(jù)對比結(jié)果判斷是否輸出喚醒結(jié)果。本發(fā)明通過語音數(shù)據(jù),將備選列表中的內(nèi)容盡可能多地列入考慮之中,本申請?zhí)峁┑募夹g(shù)方案是通過喚醒實現(xiàn),因此有效屏蔽了用戶的無效輸入;將于備選列表的內(nèi)容盡可能多地列入考慮之中,而不局限于特定詞,還能夠增加考慮用戶說的內(nèi)容,使得在篩選時更加精確。