一種對(duì)音視頻流中物品和語(yǔ)言實(shí)時(shí)識(shí)別分析的方法與裝置

基本信息

申請(qǐng)?zhí)?/td> CN202011451586.5 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112637620A 公開(kāi)(公告)日 2021-04-09
申請(qǐng)公布號(hào) CN112637620A 申請(qǐng)公布日 2021-04-09
分類號(hào) H04N21/2187;H04N21/231;H04N21/234;H04N21/431;H04N21/433;H04N21/434;H04N21/439;H04N21/44;H04N21/4788;H04N21/488;H04N21/6437 分類 電通信技術(shù);
發(fā)明人 柏楊;樊曉昆 申請(qǐng)(專利權(quán))人 杭州艾耕科技有限公司
代理機(jī)構(gòu) 杭州天昊專利代理事務(wù)所(特殊普通合伙) 代理人 何碧珩;卓彩霞
地址 310052 浙江省杭州市濱江區(qū)六和路368號(hào)一幢(北)三樓D3052室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種對(duì)音視頻流中物品和語(yǔ)言實(shí)時(shí)識(shí)別分析的方法與裝置,本發(fā)明針對(duì)現(xiàn)有的直播平臺(tái),在直播時(shí)對(duì)音視頻進(jìn)行實(shí)時(shí)處理,實(shí)現(xiàn)物品識(shí)別,語(yǔ)音識(shí)別,并將識(shí)別的結(jié)果通過(guò)貼圖的形式實(shí)時(shí)的展現(xiàn)在直播畫(huà)面中,實(shí)現(xiàn)低延時(shí)的直播處理,使得觀看者可以幾乎無(wú)延遲的看到直播內(nèi)容。本發(fā)明還可以根據(jù)直播音頻內(nèi)容產(chǎn)生豐富的關(guān)鍵字貼圖,并實(shí)時(shí)的展現(xiàn)在畫(huà)面上,直播畫(huà)面的豐富度,減少了人工處理的成本,還可以通過(guò)物品識(shí)別,在畫(huà)面上添加實(shí)時(shí)追蹤的文字或者貼圖,該類型的貼圖人工是無(wú)法做到的。