一種視頻文本提取的方法

基本信息

申請?zhí)?/td> CN201610479702.1 申請日 -
公開(公告)號 CN107545210A 公開(公告)日 2018-01-05
申請公布號 CN107545210A 申請公布日 2018-01-05
分類號 G06K9/00(2006.01)I;G06K9/32(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 張師群;羅旻 申請(專利權(quán))人 北京新岸線網(wǎng)絡(luò)技術(shù)有限公司
代理機(jī)構(gòu) - 代理人 -
地址 100084 北京市海淀區(qū)中關(guān)村東路1號院清華科技園科技大廈A座16層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種視頻文本提取的方法,包括:將視頻序列分割成單個鏡頭;在單個視頻幀序列中檢測到和定位出候選文本的具體位置;在文本定位的基礎(chǔ)上,在視頻鏡頭內(nèi)部對文本進(jìn)行跟蹤,得到同一文本對象在連續(xù)多幀的文本區(qū)域序列;利用文本跟蹤得到的文本序列對文本進(jìn)行增強,抑制背景,然后進(jìn)行二值化,得到二值化文本圖像;對二值化后的文本圖像進(jìn)行文本識別,得到文本的字符序列信息。采用本發(fā)明提供的技術(shù)方案,可以將視頻中的文本更好地從復(fù)雜多邊的背景中檢測和分離出來,提高系統(tǒng)效率,并且提高文本的質(zhì)量,從而有助于提高文本識別率。