一種文本比對(duì)方法、裝置、計(jì)算機(jī)設(shè)備及可讀存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202011292846.9 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112395851A | 公開(kāi)(公告)日 | 2021-02-23 |
申請(qǐng)公布號(hào) | CN112395851A | 申請(qǐng)公布日 | 2021-02-23 |
分類號(hào) | G06F40/194(2020.01)I; | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 郭葉;武光鼎;曹琴 | 申請(qǐng)(專利權(quán))人 | 北京北大英華科技有限公司 |
代理機(jī)構(gòu) | 北京三友知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 許曼;賈磊 |
地址 | 100080北京市海淀區(qū)中關(guān)村大街27號(hào)中關(guān)村大廈九層901-902室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種文本比對(duì)方法、裝置、計(jì)算機(jī)設(shè)備及可讀存儲(chǔ)介質(zhì),所述方法包括:從第一文本中獲取若干第一子文本以及從第二文本中獲取若干第二子文本;根據(jù)所述第一子文本以及第二子文本獲取若干相似度值;所述相似度值為一個(gè)第一子文本與一個(gè)第二子文本之間相似的程度;根據(jù)所述相似度值獲取相似文本對(duì),所述相似文本對(duì)包含第一子文本以及與該第一子文本相似度值最大的第二子文本;獲取所述相似文本對(duì)中的第一子文本與第二子文本的至少一個(gè)區(qū)別特征。通過(guò)上述方法,整個(gè)過(guò)程無(wú)需人工參與,減少人工比對(duì)文本的出錯(cuò)率,并大大提升了文本的比對(duì)效率,所以具有較高的實(shí)用價(jià)值。?? |
