一種基于SIVV特征的文檔圖像粗分類方法

基本信息

申請(qǐng)?zhí)?/td> CN201510227324.3 申請(qǐng)日 -
公開(公告)號(hào) CN104866822B 公開(公告)日 2018-08-24
申請(qǐng)公布號(hào) CN104866822B 申請(qǐng)公布日 2018-08-24
分類號(hào) G06K9/00;G06K9/62 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 馬廷淮;趙波;張正宇;霍晶晶 申請(qǐng)(專利權(quán))人 江蘇鳳凰學(xué)易教育科技有限公司
代理機(jī)構(gòu) 江蘇愛信律師事務(wù)所 代理人 南京信息工程大學(xué);江蘇鳳凰學(xué)易教育科技有限公司;北京鳳凰學(xué)易科技有限公司
地址 210044 江蘇省南京市寧六路219號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種基于SIVV特征的文檔圖像粗分類方法,包括如下步驟:獲取文檔圖像,預(yù)處理,加窗處理,計(jì)算文檔圖像SIVV特征,對(duì)每個(gè)文檔分別計(jì)算與其他文檔SIVV特征的相關(guān)系數(shù),若其中K個(gè)文檔兩兩之間相關(guān)系數(shù)均大于某一閾值,則認(rèn)為這K個(gè)文檔屬于同一分類。本發(fā)明的目的,在于提出一種新的文檔圖像粗分類方法,無需準(zhǔn)確獲取文檔文本內(nèi)容,即可將文檔圖像根據(jù)SIVV特征的相關(guān)系數(shù)自動(dòng)分成若干類,方法具有魯棒性好、分類速度快的特點(diǎn)。