一種增值稅發(fā)票信息的提取方法

基本信息

申請(qǐng)?zhí)?/td> CN201911064339.7 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN110751136A 公開(kāi)(公告)日 2020-02-04
申請(qǐng)公布號(hào) CN110751136A 申請(qǐng)公布日 2020-02-04
分類號(hào) G06K9/18;G06K9/36;G06K9/46;G06Q30/04 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 羅中;宋爽;王君健 申請(qǐng)(專利權(quán))人 北京億信華辰軟件有限責(zé)任公司武漢分公司
代理機(jī)構(gòu) - 代理人 -
地址 430200 湖北省武漢市光谷金融港B15棟7層
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種增值稅發(fā)票信息的提取方法,包括:首先,對(duì)發(fā)票圖片進(jìn)行預(yù)處理,使發(fā)票圖片無(wú)旋轉(zhuǎn)且方位正確,定位和識(shí)別發(fā)票監(jiān)制章并根據(jù)發(fā)票監(jiān)制章內(nèi)容確定發(fā)票版式;然后,利用增值稅發(fā)票的背景表格文字和打印內(nèi)容的色調(diào)差異,從發(fā)票圖片中提取藍(lán)色調(diào)像素并二值化得到打印內(nèi)容圖片;接著,根據(jù)發(fā)票版式構(gòu)造發(fā)票信息打印區(qū)域模板并利用模板對(duì)打印內(nèi)容圖片上的文本行進(jìn)行區(qū)域匹配得到發(fā)票信息圖片塊;最后,對(duì)發(fā)票信息圖片塊進(jìn)行文本識(shí)別以及綜合分析得到發(fā)票信息提取結(jié)果。本發(fā)明所涉及的一種增值稅發(fā)票信息提取方法相比于現(xiàn)有技術(shù)具有更好的容錯(cuò)性,對(duì)于發(fā)票打印內(nèi)容和背景表格文字存在重疊干擾的情況,也能很好地進(jìn)行發(fā)票信息提取。