基于常用字字頻統(tǒng)計的文本圖像倒置檢測方法及裝置

基本信息

申請?zhí)?/td> CN201811059509.8 申請日 -
公開(公告)號 CN109145907A 公開(公告)日 2019-01-04
申請公布號 CN109145907A 申請公布日 2019-01-04
分類號 G06K9/32;G06K9/46 分類 計算;推算;計數(shù);
發(fā)明人 張曙華;黃海清;楊安榮;顧偉峰 申請(專利權(quán))人 光典信息發(fā)展有限公司
代理機(jī)構(gòu) 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 上海中信信息發(fā)展股份有限公司
地址 200040 上海市靜安區(qū)昌平路710號302室
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例提供一種基于常用字字頻統(tǒng)計的文本圖像倒置檢測方法及裝置,屬于文本圖像增強(qiáng)技術(shù)領(lǐng)域。該方法包括:過獲取待檢測的文本圖像;對所述文本圖像通過OCR技術(shù)進(jìn)行識別,獲得所述文本圖像對應(yīng)的文本信息;從所述文本信息提取的所有字中查找出預(yù)設(shè)常用字,并且統(tǒng)計預(yù)設(shè)常用字的數(shù)量;基于預(yù)設(shè)常用字的數(shù)量計算所述預(yù)設(shè)常用字在所述文本信息中的所有字中的第一數(shù)量占比;基于所述第一數(shù)量占比判斷所述文本圖像是否倒置,由此,本方案中,通過統(tǒng)計文本信息中的預(yù)設(shè)常用字的第一數(shù)量占比來判斷所述文本圖像是否倒置,大大提高了文本圖像倒置檢測的質(zhì)量和效率,避免了現(xiàn)有技術(shù)中由人工對文本圖像進(jìn)行檢測造成檢測效率低下、枯燥乏味的問題。