一種基于SIVV特征的文檔圖像粗分類方法

基本信息

申請?zhí)?/td> CN201510227324.3 申請日 -
公開(公告)號 CN104866822A 公開(公告)日 2015-08-26
申請公布號 CN104866822A 申請公布日 2015-08-26
分類號 G06K9/00(2006.01)I;G06K9/62(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 馬廷淮;趙波;張正宇;霍晶晶 申請(專利權(quán))人 江蘇鳳凰學(xué)易教育科技有限公司
代理機構(gòu) 江蘇愛信律師事務(wù)所 代理人 唐小紅
地址 210044 江蘇省南京市寧六路219號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種基于SIVV特征的文檔圖像粗分類方法,包括如下步驟:獲取文檔圖像,預(yù)處理,加窗處理,計算文檔圖像SIVV特征,對每個文檔分別計算與其他文檔SIVV特征的相關(guān)系數(shù),若其中K個文檔兩兩之間相關(guān)系數(shù)均大于某一閾值,則認(rèn)為這K個文檔屬于同一分類。本發(fā)明的目的,在于提出一種新的文檔圖像粗分類方法,無需準(zhǔn)確獲取文檔文本內(nèi)容,即可將文檔圖像根據(jù)SIVV特征的相關(guān)系數(shù)自動分成若干類,方法具有魯棒性好、分類速度快的特點。