一種視頻文本提取的方法
基本信息
申請?zhí)?/td> | CN201610479702.1 | 申請日 | - |
公開(公告)號 | CN107545210A | 公開(公告)日 | 2018-01-05 |
申請公布號 | CN107545210A | 申請公布日 | 2018-01-05 |
分類號 | G06K9/00(2006.01)I;G06K9/32(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 張師群;羅旻 | 申請(專利權(quán))人 | 北京新岸線網(wǎng)絡(luò)技術(shù)有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 100084 北京市海淀區(qū)中關(guān)村東路1號院清華科技園科技大廈A座16層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種視頻文本提取的方法,包括:將視頻序列分割成單個鏡頭;在單個視頻幀序列中檢測到和定位出候選文本的具體位置;在文本定位的基礎(chǔ)上,在視頻鏡頭內(nèi)部對文本進(jìn)行跟蹤,得到同一文本對象在連續(xù)多幀的文本區(qū)域序列;利用文本跟蹤得到的文本序列對文本進(jìn)行增強,抑制背景,然后進(jìn)行二值化,得到二值化文本圖像;對二值化后的文本圖像進(jìn)行文本識別,得到文本的字符序列信息。采用本發(fā)明提供的技術(shù)方案,可以將視頻中的文本更好地從復(fù)雜多邊的背景中檢測和分離出來,提高系統(tǒng)效率,并且提高文本的質(zhì)量,從而有助于提高文本識別率。 |
