一種增值稅發(fā)票信息的提取方法
基本信息
申請(qǐng)?zhí)?/td> | CN201911064339.7 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN110751136A | 公開(kāi)(公告)日 | 2020-02-04 |
申請(qǐng)公布號(hào) | CN110751136A | 申請(qǐng)公布日 | 2020-02-04 |
分類號(hào) | G06K9/18;G06K9/36;G06K9/46;G06Q30/04 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 羅中;宋爽;王君健 | 申請(qǐng)(專利權(quán))人 | 北京億信華辰軟件有限責(zé)任公司武漢分公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 430200 湖北省武漢市光谷金融港B15棟7層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種增值稅發(fā)票信息的提取方法,包括:首先,對(duì)發(fā)票圖片進(jìn)行預(yù)處理,使發(fā)票圖片無(wú)旋轉(zhuǎn)且方位正確,定位和識(shí)別發(fā)票監(jiān)制章并根據(jù)發(fā)票監(jiān)制章內(nèi)容確定發(fā)票版式;然后,利用增值稅發(fā)票的背景表格文字和打印內(nèi)容的色調(diào)差異,從發(fā)票圖片中提取藍(lán)色調(diào)像素并二值化得到打印內(nèi)容圖片;接著,根據(jù)發(fā)票版式構(gòu)造發(fā)票信息打印區(qū)域模板并利用模板對(duì)打印內(nèi)容圖片上的文本行進(jìn)行區(qū)域匹配得到發(fā)票信息圖片塊;最后,對(duì)發(fā)票信息圖片塊進(jìn)行文本識(shí)別以及綜合分析得到發(fā)票信息提取結(jié)果。本發(fā)明所涉及的一種增值稅發(fā)票信息提取方法相比于現(xiàn)有技術(shù)具有更好的容錯(cuò)性,對(duì)于發(fā)票打印內(nèi)容和背景表格文字存在重疊干擾的情況,也能很好地進(jìn)行發(fā)票信息提取。 |
