智能文檔處理方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202111048195.3 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113761840A | 公開(公告)日 | 2021-12-07 |
申請(qǐng)公布號(hào) | CN113761840A | 申請(qǐng)公布日 | 2021-12-07 |
分類號(hào) | G06F40/143(2020.01)I;G06F16/35(2019.01)I;G06F16/81(2019.01)I;G06F40/166(2020.01)I;G06F40/258(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 郭春磊;馬麗霞;夏義鵬;王驍;李濤 | 申請(qǐng)(專利權(quán))人 | 中信建投證券股份有限公司 |
代理機(jī)構(gòu) | 北京品源專利代理有限公司 | 代理人 | 李禮 |
地址 | 100010北京市東城區(qū)朝內(nèi)大街188號(hào)鴻安國(guó)際大廈 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種智能文檔處理方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及介質(zhì),該方法包括:獲取數(shù)據(jù)源文檔的xml文件,xml文件包括至少一個(gè)段落節(jié)點(diǎn),段落節(jié)點(diǎn)中包括至少一個(gè)目標(biāo)文本節(jié)點(diǎn);對(duì)xml文件進(jìn)行標(biāo)準(zhǔn)化處理,得到目標(biāo)xml文件,標(biāo)準(zhǔn)化處理包括依次執(zhí)行的目標(biāo)文本節(jié)點(diǎn)合并、目標(biāo)文本節(jié)點(diǎn)拆分和添加節(jié)點(diǎn)標(biāo)識(shí)符;對(duì)目標(biāo)xml文件進(jìn)行壓縮處理,得到標(biāo)準(zhǔn)化數(shù)據(jù)源文檔;對(duì)標(biāo)準(zhǔn)化數(shù)據(jù)源文檔進(jìn)行數(shù)據(jù)提取,并根據(jù)數(shù)據(jù)提取結(jié)果建立文檔數(shù)據(jù)庫。本發(fā)明通過對(duì)數(shù)據(jù)源文檔進(jìn)行標(biāo)準(zhǔn)化處理及數(shù)據(jù)提取建立數(shù)據(jù)源文檔數(shù)據(jù)庫,為智能化文檔編輯操作提供數(shù)據(jù)基礎(chǔ),有利于節(jié)省人工成本和時(shí)間成本,提高文檔編輯效率和準(zhǔn)確性。 |
