不同文檔中相關(guān)句子的匹配方法、系統(tǒng)和計算機(jī)可讀存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202010559644.X | 申請日 | - |
公開(公告)號 | CN112380830A | 公開(公告)日 | 2021-02-19 |
申請公布號 | CN112380830A | 申請公布日 | 2021-02-19 |
分類號 | G06F40/194(2020.01)I;G06F40/216(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王忠萌;陳運文;王文廣;賀夢潔;胡盟;紀(jì)達(dá)麒 | 申請(專利權(quán))人 | 達(dá)觀數(shù)據(jù)有限公司 |
代理機(jī)構(gòu) | 上海智力專利商標(biāo)事務(wù)所(普通合伙) | 代理人 | 張文玄;周濤 |
地址 | 201203上海市浦東新區(qū)亮秀路112號B座301、303、304室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種不同文檔中相關(guān)句子的匹配方法,用于將基準(zhǔn)文檔中的基準(zhǔn)句子和比對文檔中的候選句子進(jìn)行匹配,所述匹配方法包括:在淺層語義、統(tǒng)計信息、深層語義三個層面上,計算候選句子相對于基準(zhǔn)句子的表示匹配程度的淺層分?jǐn)?shù)、統(tǒng)計分?jǐn)?shù)、深層分?jǐn)?shù);基于線性回歸模型擬合所述淺層分?jǐn)?shù)、統(tǒng)計分?jǐn)?shù)和深層分?jǐn)?shù),獲得用來表示所述候選句子相對于基準(zhǔn)句子的匹配度的最終分?jǐn)?shù)。本發(fā)明提高文檔匹配準(zhǔn)確性。?? |
