一種具有語(yǔ)音和圖像識(shí)別功能的向?qū)C(jī)器人

基本信息

申請(qǐng)?zhí)?/td> CN201910264736.2 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN110070865A 公開(kāi)(公告)日 2021-07-13
申請(qǐng)公布號(hào) CN110070865A 申請(qǐng)公布日 2021-07-13
分類(lèi)號(hào) G10L15/22;G10L15/02;G10L25/24;G10L25/45;B25J11/00 分類(lèi) 樂(lè)器;聲學(xué);
發(fā)明人 孫昌勛;許志強(qiáng) 申請(qǐng)(專(zhuān)利權(quán))人 北京容聯(lián)易通信息技術(shù)有限公司
代理機(jī)構(gòu) 北京睿馳通程知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 張文平
地址 100000 北京市海淀區(qū)蘇州街72號(hào)院2號(hào)樓4層北側(cè)A5
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種具有語(yǔ)音和圖像識(shí)別功能的向?qū)C(jī)器人,具體包括:語(yǔ)音輸入單元,圖像采集單元,觸摸輸入單元,語(yǔ)音處理單元,圖像處理單元,文本處理單元,決策單元,運(yùn)動(dòng)控制單元,存儲(chǔ)單元和輸出單元。所述決策單元用于接收語(yǔ)音處理單元、圖像處理單元和文本處理單元發(fā)送的信息,綜合上述信息確定機(jī)器人的運(yùn)動(dòng)軌跡和需要輸出的信息,并分別發(fā)送至運(yùn)動(dòng)控制單元和輸出單元。該向?qū)C(jī)器人,能夠通過(guò)采集用戶(hù)的語(yǔ)音信息、圖像信息以及用戶(hù)輸入的輔助信息,自主判斷用戶(hù)類(lèi)型,并基于用戶(hù)的類(lèi)型選擇合適的信息輸出形式,能夠?qū)崿F(xiàn)針對(duì)不同的用戶(hù)群體提供特定的向?qū)Х?wù)。同時(shí)向?qū)C(jī)器人能夠針對(duì)用戶(hù)的提問(wèn)實(shí)現(xiàn)與用戶(hù)的簡(jiǎn)單交流。