文本圖像與非文本圖像的分類方法和分類系統(tǒng)

基本信息

申請?zhí)?/td> CN201610892308.0 申請日 -
公開(公告)號 CN106503732A 公開(公告)日 2017-03-15
申請公布號 CN106503732A 申請公布日 2017-03-15
分類號 G06K9/62(2006.01)I;G06K9/34(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 劉寧;陳李江 申請(專利權(quán))人 淮北阿凡題教育科技有限公司
代理機構(gòu) 北京瀚仁知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 北京云江科技有限公司;淮北阿凡題教育科技有限公司
地址 100083 北京市海淀區(qū)五道口優(yōu)盛大廈A座1801室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種文本圖像與非文本圖像的分類方法和分類系統(tǒng)。其中,該方法可以包括獲取原始圖像的二值矩陣;統(tǒng)計二值矩陣中字符點所構(gòu)成的連通域,獲取符合第一預(yù)定要求的字符連通域的位置和大??;對文本行進行劃分,得到文本行的個數(shù)和位置信息,以及文本行含有的字符連通域的個數(shù)和位置信息;提取原始圖像中的線段,并計算線段的傾斜角度及傾斜角度的中位數(shù);根據(jù)線段的傾斜角度及傾斜角度的中位數(shù),計算不符合第二預(yù)定要求的線段所占的比例;統(tǒng)計原始圖像的灰度空間和HSV空間中S通道的均值和方差;根據(jù)前述步驟的結(jié)果,利用樸素貝葉斯分類模型實現(xiàn)原始圖像的分類。由此,本發(fā)明實施例解決了如何準確地從海量圖像中篩選出文本圖像的技術(shù)問題。