一種基于OCR技術(shù)的投標(biāo)文件自動(dòng)解析方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202110689006.4 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113344096A 公開(kāi)(公告)日 2021-09-03
申請(qǐng)公布號(hào) CN113344096A 申請(qǐng)公布日 2021-09-03
分類(lèi)號(hào) G06K9/62(2006.01)I;G06K9/20(2006.01)I;G06K9/34(2006.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李志慧;周?chē)?guó)峰;高于喆;李名巖;尚曉;陳偉 申請(qǐng)(專(zhuān)利權(quán))人 鄭州信源信息技術(shù)股份有限公司
代理機(jī)構(gòu) 廣州一銳專(zhuān)利代理有限公司 代理人 甘奎強(qiáng)
地址 450000河南省鄭州市高新技術(shù)產(chǎn)業(yè)開(kāi)發(fā)區(qū)蓮花街55號(hào)1號(hào)樓7層南側(cè)
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及信息采集管理技術(shù)領(lǐng)域,具體為一種基于OCR技術(shù)的投標(biāo)文件自動(dòng)解析方法及系統(tǒng),包括服務(wù)器以及移動(dòng)端,所述服務(wù)器以及移動(dòng)端上均設(shè)有信息采集單元、信息分類(lèi)單元、信息截取單元、圖像傾斜校正單元、OCR圖像識(shí)別單元以及信息輸出單元,本發(fā)明根據(jù)不同類(lèi)型的投標(biāo)項(xiàng)或投標(biāo)類(lèi)型首先進(jìn)行的是分類(lèi),確定投標(biāo)文件的的類(lèi)別,這樣根據(jù)不同種類(lèi)的投標(biāo)文就可以采用固定的模板截取出待識(shí)別信息的圖像,同時(shí)降低了后續(xù)識(shí)別的難度,其次針對(duì)投標(biāo)文件中表現(xiàn)的不同分類(lèi)內(nèi)容使用基于圖像增強(qiáng)的二次分割法,用于實(shí)現(xiàn)截取,并進(jìn)行傾斜校正這樣既降低了識(shí)別難度,又提高了OCR圖像識(shí)別單元解析的準(zhǔn)確率。