一種針對已抽取的票據(jù)信息進行再加工的方法以及系統(tǒng)
基本信息
申請?zhí)?/td> | CN202111469522.2 | 申請日 | - |
公開(公告)號 | CN114118054A | 公開(公告)日 | 2022-03-01 |
申請公布號 | CN114118054A | 申請公布日 | 2022-03-01 |
分類號 | G06F40/205(2020.01)I;G06F16/35(2019.01)I;G06F40/157(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 張強豪 | 申請(專利權(quán))人 | 金科覽智科技(北京)有限公司 |
代理機構(gòu) | 北京冬瓜知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 李佳 |
地址 | 100037北京市西城區(qū)阜成門外大街31號4層409C | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種針對已抽取的票據(jù)信息進行再加工的方法及系統(tǒng),所述票據(jù)信息再加工的方法包括:對于NER模型抽取的所有票據(jù)信息,檢索抽取要素的標(biāo)簽名,并同時獲取對應(yīng)的實體內(nèi)容進行拆解,所述拆解的方法通過AC自動機原理和KMP算法來實現(xiàn);對于NER模型抽取的所有票據(jù)信息進行標(biāo)準化處理以及信息補全。本發(fā)明的已抽取的票據(jù)信息再加工的方法針對不同的票據(jù)信息問題給予不同的解決方案,以實現(xiàn)在不同票據(jù)的NER(命名體識別)的基礎(chǔ)上進行二次拆解和標(biāo)準化。 |
