一種對(duì)音視頻流中物品和語(yǔ)言實(shí)時(shí)識(shí)別分析的方法與裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202011451586.5 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112637620A | 公開(kāi)(公告)日 | 2021-04-09 |
申請(qǐng)公布號(hào) | CN112637620A | 申請(qǐng)公布日 | 2021-04-09 |
分類號(hào) | H04N21/2187;H04N21/231;H04N21/234;H04N21/431;H04N21/433;H04N21/434;H04N21/439;H04N21/44;H04N21/4788;H04N21/488;H04N21/6437 | 分類 | 電通信技術(shù); |
發(fā)明人 | 柏楊;樊曉昆 | 申請(qǐng)(專利權(quán))人 | 杭州艾耕科技有限公司 |
代理機(jī)構(gòu) | 杭州天昊專利代理事務(wù)所(特殊普通合伙) | 代理人 | 何碧珩;卓彩霞 |
地址 | 310052 浙江省杭州市濱江區(qū)六和路368號(hào)一幢(北)三樓D3052室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種對(duì)音視頻流中物品和語(yǔ)言實(shí)時(shí)識(shí)別分析的方法與裝置,本發(fā)明針對(duì)現(xiàn)有的直播平臺(tái),在直播時(shí)對(duì)音視頻進(jìn)行實(shí)時(shí)處理,實(shí)現(xiàn)物品識(shí)別,語(yǔ)音識(shí)別,并將識(shí)別的結(jié)果通過(guò)貼圖的形式實(shí)時(shí)的展現(xiàn)在直播畫(huà)面中,實(shí)現(xiàn)低延時(shí)的直播處理,使得觀看者可以幾乎無(wú)延遲的看到直播內(nèi)容。本發(fā)明還可以根據(jù)直播音頻內(nèi)容產(chǎn)生豐富的關(guān)鍵字貼圖,并實(shí)時(shí)的展現(xiàn)在畫(huà)面上,直播畫(huà)面的豐富度,減少了人工處理的成本,還可以通過(guò)物品識(shí)別,在畫(huà)面上添加實(shí)時(shí)追蹤的文字或者貼圖,該類型的貼圖人工是無(wú)法做到的。 |
