一種視頻字幕文本提取和識別的方法

基本信息

申請?zhí)?/td> CN201110315054.3 申請日 -
公開(公告)號 CN102332096A 公開(公告)日 2012-01-25
申請公布號 CN102332096A 申請公布日 2012-01-25
分類號 G06K9/20(2006.01)I;G06K9/32(2006.01)I;G06K9/46(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉成林;白博;殷飛 申請(專利權(quán))人 北京中科閱深科技有限公司
代理機(jī)構(gòu) 中科專利商標(biāo)代理有限責(zé)任公司 代理人 周國城
地址 100190 中國北京市海淀區(qū)中關(guān)村東路95號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種視頻字幕文本提取和識別的方法,其步驟包括:輸入視頻中字幕區(qū)域的圖像;將輸入圖像轉(zhuǎn)化為灰度圖;判斷字幕區(qū)域中字符排列的方向;將豎直排列的字幕區(qū)域逆時(shí)針旋轉(zhuǎn)90°得到水平字幕區(qū)域;對字幕區(qū)域進(jìn)行分行得到單行字幕圖像;對單行字幕區(qū)域圖像自動判斷前景顏色,得到單行字幕二值圖像;對單行字幕二值圖像進(jìn)行過切分得到字符片段序列;對過切分后的單行字幕二值圖像進(jìn)行文本行識別。本方法能有效分割水平和豎直的視頻字幕文本行,準(zhǔn)確判斷字符前景顏色并濾除噪聲,并得到準(zhǔn)確的字符切分與識別結(jié)果,可以適用于視頻和圖像內(nèi)容編輯、索引與檢索等多種用途。