一種視頻字幕文本提取和識別的方法
基本信息
申請?zhí)?/td> | CN201110315054.3 | 申請日 | - |
公開(公告)號 | CN102332096A | 公開(公告)日 | 2012-01-25 |
申請公布號 | CN102332096A | 申請公布日 | 2012-01-25 |
分類號 | G06K9/20(2006.01)I;G06K9/32(2006.01)I;G06K9/46(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 劉成林;白博;殷飛 | 申請(專利權(quán))人 | 北京中科閱深科技有限公司 |
代理機(jī)構(gòu) | 中科專利商標(biāo)代理有限責(zé)任公司 | 代理人 | 周國城 |
地址 | 100190 中國北京市海淀區(qū)中關(guān)村東路95號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種視頻字幕文本提取和識別的方法,其步驟包括:輸入視頻中字幕區(qū)域的圖像;將輸入圖像轉(zhuǎn)化為灰度圖;判斷字幕區(qū)域中字符排列的方向;將豎直排列的字幕區(qū)域逆時(shí)針旋轉(zhuǎn)90°得到水平字幕區(qū)域;對字幕區(qū)域進(jìn)行分行得到單行字幕圖像;對單行字幕區(qū)域圖像自動判斷前景顏色,得到單行字幕二值圖像;對單行字幕二值圖像進(jìn)行過切分得到字符片段序列;對過切分后的單行字幕二值圖像進(jìn)行文本行識別。本方法能有效分割水平和豎直的視頻字幕文本行,準(zhǔn)確判斷字符前景顏色并濾除噪聲,并得到準(zhǔn)確的字符切分與識別結(jié)果,可以適用于視頻和圖像內(nèi)容編輯、索引與檢索等多種用途。 |
