一種機(jī)器人多輪對話語音交互方法、系統(tǒng)和終端設(shè)備
基本信息
申請?zhí)?/td> | CN202011301188.5 | 申請日 | - |
公開(公告)號 | CN112435669A | 公開(公告)日 | 2021-03-02 |
申請公布號 | CN112435669A | 申請公布日 | 2021-03-02 |
分類號 | G10L25/63(2013.01)I;G10L15/02(2006.01)I;G10L25/51(2013.01)I;G10L15/26(2006.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 馮皓;鄭曉崴 | 申請(專利權(quán))人 | 福州靈醫(yī)科技有限公司 |
代理機(jī)構(gòu) | 福州市景弘專利代理事務(wù)所(普通合伙) | 代理人 | 魏小霞;林祥翔 |
地址 | 350000福建省福州市鼓樓區(qū)軟件大道89號福州軟件園G區(qū)6號樓1層103室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及語音處理技術(shù)領(lǐng)域,特別涉及一種機(jī)器人多輪對話語音交互方法、系統(tǒng)和終端設(shè)備。所述一種機(jī)器人多輪對話語音交互方法,包括步驟:終端設(shè)備接收語音數(shù)據(jù),按幀讀取語音數(shù)據(jù);若存在連續(xù)多幀有效聲音,若連續(xù)多幀有效聲音的持續(xù)時(shí)間大于最大預(yù)設(shè)說話時(shí)間閾值,若用戶停頓時(shí)間大于最小預(yù)設(shè)停頓時(shí)間且小于最大預(yù)設(shè)停頓時(shí)間,則進(jìn)行語音識別,若用戶停頓時(shí)間大于最大預(yù)設(shè)停頓時(shí)間,則分析得用戶意圖,根據(jù)所述用戶意圖播放目標(biāo)音頻文件。本方案中的處理方式可以使得處理效率大大提高,用戶可以很快聽到終端設(shè)備的回復(fù),將大大提高互動(dòng)效率,且當(dāng)是有效聲音的時(shí)候才發(fā)送給語音識別系統(tǒng),亦可大大節(jié)約語音識別成本。?? |
