一種金融行業(yè)基于文檔結(jié)構(gòu)自動(dòng)尋找局部差異點(diǎn)的方法和裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202110440862.6 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113128195A | 公開(公告)日 | 2021-07-16 |
申請(qǐng)公布號(hào) | CN113128195A | 申請(qǐng)公布日 | 2021-07-16 |
分類號(hào) | G06F40/194(2020.01)I;G06F40/205(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 高翔;楊慧宇;章逸騁;王亞楠;陳運(yùn)文;紀(jì)達(dá)麒 | 申請(qǐng)(專利權(quán))人 | 達(dá)觀數(shù)據(jù)有限公司 |
代理機(jī)構(gòu) | 上海智力專利商標(biāo)事務(wù)所(普通合伙) | 代理人 | 周濤 |
地址 | 201203上海市浦東新區(qū)亮秀路112號(hào)B座301、303、304室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種金融行業(yè)基于文檔結(jié)構(gòu)自動(dòng)尋找局部差異點(diǎn)的方法,針對(duì)兩個(gè)文檔,所述方法包括:分別解析兩個(gè)文檔的結(jié)構(gòu),獲取兩組正文段落;將兩組正文段落進(jìn)行相似度匹配得到多個(gè)段落對(duì);對(duì)于每個(gè)段落對(duì)中的兩個(gè)段落進(jìn)行比較,獲取兩個(gè)文檔中第一文檔相對(duì)于第二文檔的差異點(diǎn)。本發(fā)明能夠自動(dòng)比較出兩個(gè)金融相關(guān)文檔的差異點(diǎn),并將差異點(diǎn)按原文檔的自然段落順序排列。 |
