一種視頻字幕文本提取和識(shí)別的方法

基本信息

申請(qǐng)?zhí)?/td> CN201110315054.3 申請(qǐng)日 -
公開(公告)號(hào) CN102332096B 公開(公告)日 2013-01-02
申請(qǐng)公布號(hào) CN102332096B 申請(qǐng)公布日 2013-01-02
分類號(hào) G06K9/20(2006.01)I;G06K9/32(2006.01)I;G06K9/46(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉成林;白博;殷飛 申請(qǐng)(專利權(quán))人 北京中科閱深科技有限公司
代理機(jī)構(gòu) 中科專利商標(biāo)代理有限責(zé)任公司 代理人 周國(guó)城
地址 100190 北京市海淀區(qū)中關(guān)村東路95號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種視頻字幕文本提取和識(shí)別的方法,其步驟包括:輸入視頻中字幕區(qū)域的圖像;將輸入圖像轉(zhuǎn)化為灰度圖;判斷字幕區(qū)域中字符排列的方向;將豎直排列的字幕區(qū)域逆時(shí)針旋轉(zhuǎn)90°得到水平字幕區(qū)域;對(duì)字幕區(qū)域進(jìn)行分行得到單行字幕圖像;對(duì)單行字幕區(qū)域圖像自動(dòng)判斷前景顏色,得到單行字幕二值圖像;對(duì)單行字幕二值圖像進(jìn)行過切分得到字符片段序列;對(duì)過切分后的單行字幕二值圖像進(jìn)行文本行識(shí)別。本方法能有效分割水平和豎直的視頻字幕文本行,準(zhǔn)確判斷字符前景顏色并濾除噪聲,并得到準(zhǔn)確的字符切分與識(shí)別結(jié)果,可以適用于視頻和圖像內(nèi)容編輯、索引與檢索等多種用途。