基于常用字字頻統(tǒng)計(jì)的文本圖像倒置檢測(cè)方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201811059509.8 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN109145907A | 公開(公告)日 | 2019-01-04 |
申請(qǐng)公布號(hào) | CN109145907A | 申請(qǐng)公布日 | 2019-01-04 |
分類號(hào) | G06K9/32;G06K9/46 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張曙華;黃海清;楊安榮;顧偉峰 | 申請(qǐng)(專利權(quán))人 | 光典信息發(fā)展有限公司 |
代理機(jī)構(gòu) | 北京超凡志成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 上海中信信息發(fā)展股份有限公司 |
地址 | 200040 上海市靜安區(qū)昌平路710號(hào)302室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實(shí)施例提供一種基于常用字字頻統(tǒng)計(jì)的文本圖像倒置檢測(cè)方法及裝置,屬于文本圖像增強(qiáng)技術(shù)領(lǐng)域。該方法包括:過獲取待檢測(cè)的文本圖像;對(duì)所述文本圖像通過OCR技術(shù)進(jìn)行識(shí)別,獲得所述文本圖像對(duì)應(yīng)的文本信息;從所述文本信息提取的所有字中查找出預(yù)設(shè)常用字,并且統(tǒng)計(jì)預(yù)設(shè)常用字的數(shù)量;基于預(yù)設(shè)常用字的數(shù)量計(jì)算所述預(yù)設(shè)常用字在所述文本信息中的所有字中的第一數(shù)量占比;基于所述第一數(shù)量占比判斷所述文本圖像是否倒置,由此,本方案中,通過統(tǒng)計(jì)文本信息中的預(yù)設(shè)常用字的第一數(shù)量占比來判斷所述文本圖像是否倒置,大大提高了文本圖像倒置檢測(cè)的質(zhì)量和效率,避免了現(xiàn)有技術(shù)中由人工對(duì)文本圖像進(jìn)行檢測(cè)造成檢測(cè)效率低下、枯燥乏味的問題。 |
