一種視頻文本提取的方法
基本信息
申請(qǐng)?zhí)?/td> | CN201610479702.1 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN107545210A | 公開(kāi)(公告)日 | 2018-01-05 |
申請(qǐng)公布號(hào) | CN107545210A | 申請(qǐng)公布日 | 2018-01-05 |
分類號(hào) | G06K9/00(2006.01)I;G06K9/32(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張師群;羅旻 | 申請(qǐng)(專利權(quán))人 | 北京新岸線網(wǎng)絡(luò)技術(shù)有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 100084 北京市海淀區(qū)中關(guān)村東路1號(hào)院清華科技園科技大廈A座16層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種視頻文本提取的方法,包括:將視頻序列分割成單個(gè)鏡頭;在單個(gè)視頻幀序列中檢測(cè)到和定位出候選文本的具體位置;在文本定位的基礎(chǔ)上,在視頻鏡頭內(nèi)部對(duì)文本進(jìn)行跟蹤,得到同一文本對(duì)象在連續(xù)多幀的文本區(qū)域序列;利用文本跟蹤得到的文本序列對(duì)文本進(jìn)行增強(qiáng),抑制背景,然后進(jìn)行二值化,得到二值化文本圖像;對(duì)二值化后的文本圖像進(jìn)行文本識(shí)別,得到文本的字符序列信息。采用本發(fā)明提供的技術(shù)方案,可以將視頻中的文本更好地從復(fù)雜多邊的背景中檢測(cè)和分離出來(lái),提高系統(tǒng)效率,并且提高文本的質(zhì)量,從而有助于提高文本識(shí)別率。 |
