自助語音服務(wù)中的語音播報(bào)中止方法、裝置、設(shè)備及介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110366818.5 申請(qǐng)日 -
公開(公告)號(hào) CN113257242A 公開(公告)日 2021-08-13
申請(qǐng)公布號(hào) CN113257242A 申請(qǐng)公布日 2021-08-13
分類號(hào) G10L15/22(2006.01)I;G10L15/02(2006.01)I;G10L15/04(2013.01)I;G10L15/06(2013.01)I;G10L15/26(2006.01)I;G10L25/27(2013.01)I;G10L25/45(2013.01)I;G10L25/51(2013.01)I;G10L25/75(2013.01)I;G06N20/00(2019.01)I 分類 樂器;聲學(xué);
發(fā)明人 嵇望;黃河;曹禹;張廣昊 申請(qǐng)(專利權(quán))人 杭州遠(yuǎn)傳新業(yè)科技股份有限公司
代理機(jī)構(gòu) 杭州創(chuàng)智卓英知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 張超
地址 310051浙江省杭州市濱江區(qū)信誠路857號(hào)世貿(mào)中心23樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種自助語音服務(wù)中的語音播報(bào)中止方法、裝置、電子設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì),涉及語音識(shí)別技術(shù)領(lǐng)域,旨在提高語音打斷速度。該方法包含以下步驟:提取用戶方語音作為源語音樣本,對(duì)源語音樣本進(jìn)行分幀和聲音特征提取,形成源語音特征數(shù)據(jù);將源語音樣本輸入語音識(shí)別系統(tǒng)進(jìn)行語音識(shí)別,得到語音轉(zhuǎn)譯數(shù)據(jù);根據(jù)語音轉(zhuǎn)譯數(shù)據(jù),標(biāo)識(shí)源語音特征數(shù)據(jù)的特征,形成語音特征樣本;通過機(jī)器學(xué)習(xí)算法對(duì)語音特征樣本進(jìn)行學(xué)習(xí),形成人聲語音特征;通過人聲語音特征,在呼叫過程中判斷目標(biāo)用戶方的語音是否為人聲,并根據(jù)判斷結(jié)果,確定是否中止自助語音播放。