不同文檔中相關(guān)句子的匹配方法、系統(tǒng)和計算機(jī)可讀存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202010559644.X 申請日 -
公開(公告)號 CN112380830A 公開(公告)日 2021-02-19
申請公布號 CN112380830A 申請公布日 2021-02-19
分類號 G06F40/194(2020.01)I;G06F40/216(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王忠萌;陳運文;王文廣;賀夢潔;胡盟;紀(jì)達(dá)麒 申請(專利權(quán))人 達(dá)觀數(shù)據(jù)有限公司
代理機(jī)構(gòu) 上海智力專利商標(biāo)事務(wù)所(普通合伙) 代理人 張文玄;周濤
地址 201203上海市浦東新區(qū)亮秀路112號B座301、303、304室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種不同文檔中相關(guān)句子的匹配方法,用于將基準(zhǔn)文檔中的基準(zhǔn)句子和比對文檔中的候選句子進(jìn)行匹配,所述匹配方法包括:在淺層語義、統(tǒng)計信息、深層語義三個層面上,計算候選句子相對于基準(zhǔn)句子的表示匹配程度的淺層分?jǐn)?shù)、統(tǒng)計分?jǐn)?shù)、深層分?jǐn)?shù);基于線性回歸模型擬合所述淺層分?jǐn)?shù)、統(tǒng)計分?jǐn)?shù)和深層分?jǐn)?shù),獲得用來表示所述候選句子相對于基準(zhǔn)句子的匹配度的最終分?jǐn)?shù)。本發(fā)明提高文檔匹配準(zhǔn)確性。??