一種針對已抽取的票據(jù)信息進行再加工的方法以及系統(tǒng)

基本信息

申請?zhí)?/td> CN202111469522.2 申請日 -
公開(公告)號 CN114118054A 公開(公告)日 2022-03-01
申請公布號 CN114118054A 申請公布日 2022-03-01
分類號 G06F40/205(2020.01)I;G06F16/35(2019.01)I;G06F40/157(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 張強豪 申請(專利權(quán))人 金科覽智科技(北京)有限公司
代理機構(gòu) 北京冬瓜知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 李佳
地址 100037北京市西城區(qū)阜成門外大街31號4層409C
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種針對已抽取的票據(jù)信息進行再加工的方法及系統(tǒng),所述票據(jù)信息再加工的方法包括:對于NER模型抽取的所有票據(jù)信息,檢索抽取要素的標(biāo)簽名,并同時獲取對應(yīng)的實體內(nèi)容進行拆解,所述拆解的方法通過AC自動機原理和KMP算法來實現(xiàn);對于NER模型抽取的所有票據(jù)信息進行標(biāo)準化處理以及信息補全。本發(fā)明的已抽取的票據(jù)信息再加工的方法針對不同的票據(jù)信息問題給予不同的解決方案,以實現(xiàn)在不同票據(jù)的NER(命名體識別)的基礎(chǔ)上進行二次拆解和標(biāo)準化。