文本圖像與非文本圖像的分類方法和分類系統(tǒng)
基本信息
申請?zhí)?/td> | CN201610892308.0 | 申請日 | - |
公開(公告)號 | CN106503732B | 公開(公告)日 | 2019-07-19 |
申請公布號 | CN106503732B | 申請公布日 | 2019-07-19 |
分類號 | G06K9/62;G06K9/34 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 劉寧;陳李江 | 申請(專利權(quán))人 | 淮北阿凡題教育科技有限公司 |
代理機(jī)構(gòu) | 北京瀚仁知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 北京云江科技有限公司;淮北阿凡題教育科技有限公司 |
地址 | 100083 北京市海淀區(qū)五道口優(yōu)盛大廈A座1801室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種文本圖像與非文本圖像的分類方法和分類系統(tǒng)。其中,該方法可以包括獲取原始圖像的二值矩陣;統(tǒng)計(jì)二值矩陣中字符點(diǎn)所構(gòu)成的連通域,獲取符合第一預(yù)定要求的字符連通域的位置和大??;對文本行進(jìn)行劃分,得到文本行的個(gè)數(shù)和位置信息,以及文本行含有的字符連通域的個(gè)數(shù)和位置信息;提取原始圖像中的線段,并計(jì)算線段的傾斜角度及傾斜角度的中位數(shù);根據(jù)線段的傾斜角度及傾斜角度的中位數(shù),計(jì)算不符合第二預(yù)定要求的線段所占的比例;統(tǒng)計(jì)原始圖像的灰度空間和HSV空間中S通道的均值和方差;根據(jù)前述步驟的結(jié)果,利用樸素貝葉斯分類模型實(shí)現(xiàn)原始圖像的分類。由此,本發(fā)明實(shí)施例解決了如何準(zhǔn)確地從海量圖像中篩選出文本圖像的技術(shù)問題。 |
