一種從合同簡(jiǎn)體遷移到繁體的光學(xué)字符聯(lián)合訓(xùn)練及識(shí)別方法
基本信息
申請(qǐng)?zhí)?/td> | CN202010485822.9 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN111651960A | 公開(公告)日 | 2020-09-11 |
申請(qǐng)公布號(hào) | CN111651960A | 申請(qǐng)公布日 | 2020-09-11 |
分類號(hào) | G06F40/109(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 謝澤星;吳青昀;徐俊杰 | 申請(qǐng)(專利權(quán))人 | 杭州尚尚簽網(wǎng)絡(luò)科技有限公司 |
代理機(jī)構(gòu) | 杭州求是專利事務(wù)所有限公司 | 代理人 | 杭州尚尚簽網(wǎng)絡(luò)科技有限公司 |
地址 | 310012浙江省杭州市西湖區(qū)萬(wàn)塘路317號(hào)華星世紀(jì)大樓2層202房 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種從合同簡(jiǎn)體遷移到繁體的光學(xué)字符聯(lián)合訓(xùn)練及識(shí)別方法,包括:建立多任務(wù)字符識(shí)別模型;將多任務(wù)字符識(shí)別模型進(jìn)行訓(xùn)練,得到訓(xùn)練后的多任務(wù)字符識(shí)別模型;向訓(xùn)練后的多任務(wù)字符識(shí)別模型輸入包含簡(jiǎn)體字和繁體字的合同圖片,得到各子任務(wù)的識(shí)別結(jié)果以及直接解碼的識(shí)別結(jié)果,然后通過(guò)分別比較各子任務(wù)的識(shí)別結(jié)果與直接解碼的識(shí)別結(jié)果間的編輯距離聯(lián)合修正,得到識(shí)別結(jié)果。本發(fā)明通過(guò)多個(gè)擬人策略多任務(wù)模塊聯(lián)合訓(xùn)練方式加強(qiáng)模型對(duì)文字形態(tài)特征挖掘,通用簡(jiǎn)單特征的理解,能夠增加模型的魯棒性,減少訓(xùn)練數(shù)據(jù)量,加快模型的構(gòu)件速度。?? |
