一種基于圖書服務(wù)機(jī)器人的語音交互裝置

基本信息

申請?zhí)?/td> CN201720046477.2 申請日 -
公開(公告)號 CN206672635U 公開(公告)日 2017-11-24
申請公布號 CN206672635U 申請公布日 2017-11-24
分類號 G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/26(2006.01)I;G10L15/30(2013.01)I;G10L17/22(2013.01)I;G10L19/018(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 王海峰 申請(專利權(quán))人 北京鈺鼎智能科技有限公司
代理機(jī)構(gòu) 北京律遠(yuǎn)專利代理事務(wù)所(普通合伙) 代理人 北京星宇聯(lián)合投資管理有限公司
地址 100084 北京市海淀區(qū)農(nóng)大南路1號院2號樓2層B-221-110
法律狀態(tài) -

摘要

摘要 本實(shí)用新型公開了一種基于圖書機(jī)器人的語音交互裝置,裝置包括移動(dòng)端語音采集模塊,語音傳輸模塊,語音識(shí)別模塊,關(guān)鍵詞檢測模塊,信息推送模塊和離線訓(xùn)練模塊;首先從圖書機(jī)器人本體機(jī)器人或手機(jī)應(yīng)用端的拾音器上不斷的采集聲音信號,采用關(guān)鍵詞檢測算法進(jìn)行喚醒檢測,當(dāng)檢測到喚醒關(guān)鍵詞后,送入聲紋識(shí)別單元,聲紋識(shí)別模塊主要完成對說話人身份的識(shí)別,通過對梅爾倒譜系數(shù)的提取,得到說話人聲音特征,以GMM高斯混合模型建立訓(xùn)練庫并與庫內(nèi)的聲紋特征參數(shù)進(jìn)行匹配,得到說話人信息后,將語音信號送入自然語言識(shí)別單元,結(jié)合說話人歷史訪問信息,向其提供興趣圖書推薦、繼續(xù)閱讀有聲圖書、書籍內(nèi)容定向快速提取、以及與作者機(jī)器人對話的服務(wù)。