一種輔助語音交互的方法及系統(tǒng)、存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110587518.X 申請(qǐng)日 -
公開(公告)號(hào) CN113380243A 公開(公告)日 2021-09-10
申請(qǐng)公布號(hào) CN113380243A 申請(qǐng)公布日 2021-09-10
分類號(hào) G10L15/22(2006.01)I;G06K9/00(2006.01)I 分類 樂器;聲學(xué);
發(fā)明人 韓小平;曾慶寧;胡建良;熊清海;李志超 申請(qǐng)(專利權(quán))人 廣州廣電運(yùn)通金融電子股份有限公司
代理機(jī)構(gòu) 杭州創(chuàng)智卓英知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 張超
地址 510000廣東省廣州市高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)科學(xué)城科林路9、11號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種輔助語音交互的方法及系統(tǒng)、存儲(chǔ)介質(zhì),所述方法包括以下步驟:在用戶與設(shè)備進(jìn)行語音交互時(shí),通過人臉檢測模塊對(duì)設(shè)定區(qū)域進(jìn)行人臉檢測;在設(shè)定區(qū)域內(nèi)檢測到人臉時(shí),開啟語音拾音操作,獲取語音數(shù)據(jù);對(duì)獲取到的語音數(shù)據(jù)進(jìn)行語音識(shí)別;所述在設(shè)定區(qū)域內(nèi)檢測到人臉時(shí),開啟語音拾音操作包括:在檢測到多個(gè)人臉時(shí),獲取距離設(shè)備最近的人臉,采集距離設(shè)備最近的人臉對(duì)應(yīng)的語音數(shù)據(jù);在檢測到單個(gè)人臉時(shí),采集所述單個(gè)人臉對(duì)應(yīng)的語音數(shù)據(jù)。本發(fā)明通過視頻輔助語音交互,避免了軌道交通場景中人員多導(dǎo)致的干擾語音多的問題,同時(shí)避免了在語音交互時(shí),多個(gè)人出現(xiàn)在設(shè)備前導(dǎo)致的語音干擾問題。