一種輔助語音交互的方法及系統(tǒng)、存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202110587518.X | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113380243A | 公開(公告)日 | 2021-09-10 |
申請(qǐng)公布號(hào) | CN113380243A | 申請(qǐng)公布日 | 2021-09-10 |
分類號(hào) | G10L15/22(2006.01)I;G06K9/00(2006.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 韓小平;曾慶寧;胡建良;熊清海;李志超 | 申請(qǐng)(專利權(quán))人 | 廣州廣電運(yùn)通金融電子股份有限公司 |
代理機(jī)構(gòu) | 杭州創(chuàng)智卓英知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 張超 |
地址 | 510000廣東省廣州市高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)科學(xué)城科林路9、11號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種輔助語音交互的方法及系統(tǒng)、存儲(chǔ)介質(zhì),所述方法包括以下步驟:在用戶與設(shè)備進(jìn)行語音交互時(shí),通過人臉檢測模塊對(duì)設(shè)定區(qū)域進(jìn)行人臉檢測;在設(shè)定區(qū)域內(nèi)檢測到人臉時(shí),開啟語音拾音操作,獲取語音數(shù)據(jù);對(duì)獲取到的語音數(shù)據(jù)進(jìn)行語音識(shí)別;所述在設(shè)定區(qū)域內(nèi)檢測到人臉時(shí),開啟語音拾音操作包括:在檢測到多個(gè)人臉時(shí),獲取距離設(shè)備最近的人臉,采集距離設(shè)備最近的人臉對(duì)應(yīng)的語音數(shù)據(jù);在檢測到單個(gè)人臉時(shí),采集所述單個(gè)人臉對(duì)應(yīng)的語音數(shù)據(jù)。本發(fā)明通過視頻輔助語音交互,避免了軌道交通場景中人員多導(dǎo)致的干擾語音多的問題,同時(shí)避免了在語音交互時(shí),多個(gè)人出現(xiàn)在設(shè)備前導(dǎo)致的語音干擾問題。 |
