語(yǔ)音數(shù)據(jù)處理方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN201711364085.1 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN108320733A 公開(kāi)(公告)日 2018-07-24
申請(qǐng)公布號(hào) CN108320733A 申請(qǐng)公布日 2018-07-24
分類(lèi)號(hào) G10L15/02;G10L15/06;G10L15/14;G10L25/90;G10L25/93 分類(lèi) 樂(lè)器;聲學(xué);
發(fā)明人 吳國(guó)兵;潘嘉 申請(qǐng)(專(zhuān)利權(quán))人 上??拼笥嶏w信息科技有限公司
代理機(jī)構(gòu) 深圳市華優(yōu)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 余薇
地址 200000 上海市浦東新區(qū)南匯新城鎮(zhèn)環(huán)湖西二路888號(hào)2幢1區(qū)3065室
法律狀態(tài) -

摘要

摘要 本公開(kāi)提供一種語(yǔ)音數(shù)據(jù)處理方法及裝置、存儲(chǔ)介質(zhì)、電子設(shè)備。該方法包括:獲取用戶(hù)輸入的語(yǔ)音數(shù)據(jù),所述語(yǔ)音數(shù)據(jù)包括成功喚醒智能終端的喚醒語(yǔ)音數(shù)據(jù),以及表示操作意圖的控制語(yǔ)音數(shù)據(jù);提取所述語(yǔ)音數(shù)據(jù)的聲學(xué)層面特征和/或語(yǔ)義層面特征,所述聲學(xué)層面特征用于表示用戶(hù)的發(fā)音特征,所述語(yǔ)義層面特征用于表示所述語(yǔ)音數(shù)據(jù)的文本特征;將所述聲學(xué)層面特征和/或語(yǔ)義層面特征作為輸入,經(jīng)預(yù)先構(gòu)建的語(yǔ)音判別模型處理后,確定所述喚醒語(yǔ)音數(shù)據(jù)是否為誤喚醒數(shù)據(jù)。如此方案,利用篩除了誤喚醒數(shù)據(jù)的喚醒語(yǔ)音數(shù)據(jù)進(jìn)行模型優(yōu)化,有助于提高喚醒模型的優(yōu)化性能。