一種基于音視頻識別的智能顯示方法及其裝置
基本信息
申請?zhí)?/td> | CN201910296455.5 | 申請日 | - |
公開(公告)號 | CN110021297A | 公開(公告)日 | 2019-07-16 |
申請公布號 | CN110021297A | 申請公布日 | 2019-07-16 |
分類號 | G10L15/22;G10L21/055;G06K9/00 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 倪雪平;尹大海;金文俊;倪末萍 | 申請(專利權(quán))人 | 上海影隆光電股份有限公司 |
代理機(jī)構(gòu) | 北京維正專利代理有限公司 | 代理人 | 謝緒寧;薛赟 |
地址 | 201800 上海市嘉定區(qū)南翔鎮(zhèn)蕰北公路1755弄16號3層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及交互顯示技術(shù)領(lǐng)域,公開了一種基于音視頻識別的智能顯示方法及其裝置,方法包括:采集圖像數(shù)據(jù)與音頻數(shù)據(jù);從圖像數(shù)據(jù)中識別出圖像目標(biāo)及其在圖像數(shù)據(jù)中的位置坐標(biāo);根據(jù)位置坐標(biāo)識別圖像目標(biāo)所屬的局部動作;從音頻數(shù)據(jù)中識別出音頻目標(biāo)以及音頻目標(biāo)所屬的局部音頻;匹配局部動作與局部音頻;若匹配成功,則根據(jù)位置坐標(biāo)在圖像數(shù)據(jù)中添加標(biāo)記符號;顯示圖像數(shù)據(jù);判斷局部動作與局部音頻動作是否對應(yīng),若對應(yīng),則代表圖像目標(biāo)識別正確,然后顯示帶有標(biāo)記符號的圖像數(shù)據(jù),控制了位置坐標(biāo)的準(zhǔn)確率處于高的水平,用戶能同時使用動作以及聲音參與控制或者改變顯示圖像內(nèi)容。 |
