一種金融類pdf掃描件的文本識(shí)別方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202110735367.8 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113469029A | 公開(公告)日 | 2021-10-01 |
申請(qǐng)公布號(hào) | CN113469029A | 申請(qǐng)公布日 | 2021-10-01 |
分類號(hào) | G06K9/00(2006.01)I;G06K9/34(2006.01)I;G06K9/32(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 金鑫;李鵬輝 | 申請(qǐng)(專利權(quán))人 | 上海犀語科技有限公司 |
代理機(jī)構(gòu) | 上海樂泓專利代理事務(wù)所(普通合伙) | 代理人 | 王瑞 |
地址 | 200082上海市楊浦區(qū)偉德路6號(hào)1005-18室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種金融類pdf掃描件的文本識(shí)別方法,它包括創(chuàng)建圖像生成模板;在圖像生成模板中插入模板信息,使用圖像生成模板生成訓(xùn)練圖像利用生成的訓(xùn)練圖像作為訓(xùn)練數(shù)據(jù),訓(xùn)練文本識(shí)別模型;使用文本識(shí)別模型識(shí)別pdf掃描件。本發(fā)明還公開了一種金融類pdf掃描件的文本識(shí)別裝置,包括模板創(chuàng)建模塊、訓(xùn)練圖像生成模塊、文本識(shí)別模型訓(xùn)練模塊、文本識(shí)別服務(wù)模塊、校驗(yàn)?zāi)K。本發(fā)明的一種金融類pdf掃描件的文本識(shí)別方法及裝置,無需大量人工標(biāo)注,能夠在字體模糊、方向傾斜、水印等復(fù)雜情況下實(shí)現(xiàn)對(duì)pdf掃描件的自動(dòng)識(shí)別,且識(shí)別效率高,提高了pdf掃描件的識(shí)別準(zhǔn)確率。 |
