基于常用字字頻統(tǒng)計(jì)的文本圖像倒置檢測(cè)方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201811059509.8 申請(qǐng)日 -
公開(公告)號(hào) CN109145907A 公開(公告)日 2019-01-04
申請(qǐng)公布號(hào) CN109145907A 申請(qǐng)公布日 2019-01-04
分類號(hào) G06K9/32;G06K9/46 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張曙華;黃海清;楊安榮;顧偉峰 申請(qǐng)(專利權(quán))人 光典信息發(fā)展有限公司
代理機(jī)構(gòu) 北京超凡志成知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 上海中信信息發(fā)展股份有限公司
地址 200040 上海市靜安區(qū)昌平路710號(hào)302室
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例提供一種基于常用字字頻統(tǒng)計(jì)的文本圖像倒置檢測(cè)方法及裝置,屬于文本圖像增強(qiáng)技術(shù)領(lǐng)域。該方法包括:過獲取待檢測(cè)的文本圖像;對(duì)所述文本圖像通過OCR技術(shù)進(jìn)行識(shí)別,獲得所述文本圖像對(duì)應(yīng)的文本信息;從所述文本信息提取的所有字中查找出預(yù)設(shè)常用字,并且統(tǒng)計(jì)預(yù)設(shè)常用字的數(shù)量;基于預(yù)設(shè)常用字的數(shù)量計(jì)算所述預(yù)設(shè)常用字在所述文本信息中的所有字中的第一數(shù)量占比;基于所述第一數(shù)量占比判斷所述文本圖像是否倒置,由此,本方案中,通過統(tǒng)計(jì)文本信息中的預(yù)設(shè)常用字的第一數(shù)量占比來判斷所述文本圖像是否倒置,大大提高了文本圖像倒置檢測(cè)的質(zhì)量和效率,避免了現(xiàn)有技術(shù)中由人工對(duì)文本圖像進(jìn)行檢測(cè)造成檢測(cè)效率低下、枯燥乏味的問題。