一種基于音視頻識別的智能顯示方法及其裝置

基本信息

申請?zhí)?/td> CN201910296455.5 申請日 -
公開(公告)號 CN110021297A 公開(公告)日 2019-07-16
申請公布號 CN110021297A 申請公布日 2019-07-16
分類號 G10L15/22;G10L21/055;G06K9/00 分類 樂器;聲學(xué);
發(fā)明人 倪雪平;尹大海;金文俊;倪末萍 申請(專利權(quán))人 上海影隆光電股份有限公司
代理機(jī)構(gòu) 北京維正專利代理有限公司 代理人 謝緒寧;薛赟
地址 201800 上海市嘉定區(qū)南翔鎮(zhèn)蕰北公路1755弄16號3層
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及交互顯示技術(shù)領(lǐng)域,公開了一種基于音視頻識別的智能顯示方法及其裝置,方法包括:采集圖像數(shù)據(jù)與音頻數(shù)據(jù);從圖像數(shù)據(jù)中識別出圖像目標(biāo)及其在圖像數(shù)據(jù)中的位置坐標(biāo);根據(jù)位置坐標(biāo)識別圖像目標(biāo)所屬的局部動作;從音頻數(shù)據(jù)中識別出音頻目標(biāo)以及音頻目標(biāo)所屬的局部音頻;匹配局部動作與局部音頻;若匹配成功,則根據(jù)位置坐標(biāo)在圖像數(shù)據(jù)中添加標(biāo)記符號;顯示圖像數(shù)據(jù);判斷局部動作與局部音頻動作是否對應(yīng),若對應(yīng),則代表圖像目標(biāo)識別正確,然后顯示帶有標(biāo)記符號的圖像數(shù)據(jù),控制了位置坐標(biāo)的準(zhǔn)確率處于高的水平,用戶能同時使用動作以及聲音參與控制或者改變顯示圖像內(nèi)容。