一種視頻文本提取的方法

基本信息

申請(qǐng)?zhí)?/td> CN201610479702.1 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN107545210A 公開(kāi)(公告)日 2018-01-05
申請(qǐng)公布號(hào) CN107545210A 申請(qǐng)公布日 2018-01-05
分類號(hào) G06K9/00(2006.01)I;G06K9/32(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張師群;羅旻 申請(qǐng)(專利權(quán))人 北京新岸線網(wǎng)絡(luò)技術(shù)有限公司
代理機(jī)構(gòu) - 代理人 -
地址 100084 北京市海淀區(qū)中關(guān)村東路1號(hào)院清華科技園科技大廈A座16層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種視頻文本提取的方法,包括:將視頻序列分割成單個(gè)鏡頭;在單個(gè)視頻幀序列中檢測(cè)到和定位出候選文本的具體位置;在文本定位的基礎(chǔ)上,在視頻鏡頭內(nèi)部對(duì)文本進(jìn)行跟蹤,得到同一文本對(duì)象在連續(xù)多幀的文本區(qū)域序列;利用文本跟蹤得到的文本序列對(duì)文本進(jìn)行增強(qiáng),抑制背景,然后進(jìn)行二值化,得到二值化文本圖像;對(duì)二值化后的文本圖像進(jìn)行文本識(shí)別,得到文本的字符序列信息。采用本發(fā)明提供的技術(shù)方案,可以將視頻中的文本更好地從復(fù)雜多邊的背景中檢測(cè)和分離出來(lái),提高系統(tǒng)效率,并且提高文本的質(zhì)量,從而有助于提高文本識(shí)別率。