一種隨機(jī)版式票據(jù)圖像合成的基礎(chǔ)數(shù)據(jù)集構(gòu)建方法
基本信息
申請(qǐng)?zhí)?/td> | CN202210371837.1 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN114722785A | 公開(kāi)(公告)日 | 2022-07-08 |
申請(qǐng)公布號(hào) | CN114722785A | 申請(qǐng)公布日 | 2022-07-08 |
分類號(hào) | G06F40/177(2020.01)I;G06F40/174(2020.01)I;G06F40/183(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 朱紅;寇俊霞;李果;牛浩然 | 申請(qǐng)(專利權(quán))人 | 中國(guó)礦業(yè)大學(xué)(北京) |
代理機(jī)構(gòu) | 北京華仁聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | - |
地址 | 100083北京市海淀區(qū)學(xué)院路丁11號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種隨機(jī)版式票據(jù)圖像合成的基礎(chǔ)數(shù)據(jù)集構(gòu)建方法,包括票據(jù)表格線繪制、劃定票據(jù)項(xiàng)目文本信息所在區(qū)域、填充票據(jù)項(xiàng)目文本信息到確定區(qū)域等3個(gè)部分,基于常見(jiàn)票據(jù)特征和票據(jù)版面文本關(guān)系最終得以實(shí)現(xiàn)。票據(jù)表格線繪制部分用于生成版式布局隨機(jī)的票據(jù)表格。劃定票據(jù)項(xiàng)目文本信息所在區(qū)域用于在票據(jù)憑證中選取位置分布隨機(jī)、映射關(guān)系各樣的票據(jù)項(xiàng)目文本信息區(qū)域。填充票據(jù)文本信息到確定區(qū)域用于生成票據(jù)相似文本并將其填充到確定好的區(qū)域,最終合成了隨機(jī)版式票據(jù)圖像。利用本發(fā)明方法合成的票據(jù)樣本版式布局多樣、布局分布合理、票據(jù)文本多樣,能有效提升文本定位網(wǎng)絡(luò)模型的準(zhǔn)確率。 |
