一種機(jī)器人多輪對話語音交互方法、系統(tǒng)和終端設(shè)備

基本信息

申請?zhí)?/td> CN202011301188.5 申請日 -
公開(公告)號 CN112435669A 公開(公告)日 2021-03-02
申請公布號 CN112435669A 申請公布日 2021-03-02
分類號 G10L25/63(2013.01)I;G10L15/02(2006.01)I;G10L25/51(2013.01)I;G10L15/26(2006.01)I 分類 樂器;聲學(xué);
發(fā)明人 馮皓;鄭曉崴 申請(專利權(quán))人 福州靈醫(yī)科技有限公司
代理機(jī)構(gòu) 福州市景弘專利代理事務(wù)所(普通合伙) 代理人 魏小霞;林祥翔
地址 350000福建省福州市鼓樓區(qū)軟件大道89號福州軟件園G區(qū)6號樓1層103室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及語音處理技術(shù)領(lǐng)域,特別涉及一種機(jī)器人多輪對話語音交互方法、系統(tǒng)和終端設(shè)備。所述一種機(jī)器人多輪對話語音交互方法,包括步驟:終端設(shè)備接收語音數(shù)據(jù),按幀讀取語音數(shù)據(jù);若存在連續(xù)多幀有效聲音,若連續(xù)多幀有效聲音的持續(xù)時(shí)間大于最大預(yù)設(shè)說話時(shí)間閾值,若用戶停頓時(shí)間大于最小預(yù)設(shè)停頓時(shí)間且小于最大預(yù)設(shè)停頓時(shí)間,則進(jìn)行語音識別,若用戶停頓時(shí)間大于最大預(yù)設(shè)停頓時(shí)間,則分析得用戶意圖,根據(jù)所述用戶意圖播放目標(biāo)音頻文件。本方案中的處理方式可以使得處理效率大大提高,用戶可以很快聽到終端設(shè)備的回復(fù),將大大提高互動(dòng)效率,且當(dāng)是有效聲音的時(shí)候才發(fā)送給語音識別系統(tǒng),亦可大大節(jié)約語音識別成本。??