文本圖像與非文本圖像的分類方法和分類系統(tǒng)

基本信息

申請?zhí)?/td> CN201610892308.0 申請日 -
公開(公告)號 CN106503732B 公開(公告)日 2019-07-19
申請公布號 CN106503732B 申請公布日 2019-07-19
分類號 G06K9/62;G06K9/34 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉寧;陳李江 申請(專利權(quán))人 淮北阿凡題教育科技有限公司
代理機(jī)構(gòu) 北京瀚仁知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 北京云江科技有限公司;淮北阿凡題教育科技有限公司
地址 100083 北京市海淀區(qū)五道口優(yōu)盛大廈A座1801室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種文本圖像與非文本圖像的分類方法和分類系統(tǒng)。其中,該方法可以包括獲取原始圖像的二值矩陣;統(tǒng)計(jì)二值矩陣中字符點(diǎn)所構(gòu)成的連通域,獲取符合第一預(yù)定要求的字符連通域的位置和大??;對文本行進(jìn)行劃分,得到文本行的個(gè)數(shù)和位置信息,以及文本行含有的字符連通域的個(gè)數(shù)和位置信息;提取原始圖像中的線段,并計(jì)算線段的傾斜角度及傾斜角度的中位數(shù);根據(jù)線段的傾斜角度及傾斜角度的中位數(shù),計(jì)算不符合第二預(yù)定要求的線段所占的比例;統(tǒng)計(jì)原始圖像的灰度空間和HSV空間中S通道的均值和方差;根據(jù)前述步驟的結(jié)果,利用樸素貝葉斯分類模型實(shí)現(xiàn)原始圖像的分類。由此,本發(fā)明實(shí)施例解決了如何準(zhǔn)確地從海量圖像中篩選出文本圖像的技術(shù)問題。