文本相似度檢測方法、裝置及電子設(shè)備
基本信息
申請?zhí)?/td> | CN201911321980.4 | 申請日 | - |
公開(公告)號 | CN111104484B | 公開(公告)日 | 2021-09-03 |
申請公布號 | CN111104484B | 申請公布日 | 2021-09-03 |
分類號 | G06F16/33;G06F21/16 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王超;熊英超 | 申請(專利權(quán))人 | 南京中孚信息技術(shù)有限公司 |
代理機構(gòu) | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) | 代理人 | 董艷芳 |
地址 | 210000 江蘇省南京市浦口區(qū)江浦街道仁山路1號園區(qū)2號樓辦公室東側(cè)ER202室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種文本相似度檢測方法、裝置及電子設(shè)備,涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,本發(fā)明在獲取到兩個文本的初始指紋特征后,基于滑動窗口算法和數(shù)字指紋的大小對初始指紋特征進行了目標數(shù)字指紋的提取,且進行目標數(shù)字指紋的提取時,下一個滑動窗口的起始點與前一個滑動窗口內(nèi)所提取出的目標數(shù)字指紋有關(guān),這樣在保證檢測準確度的基礎(chǔ)上,減少了目標指紋特征中數(shù)字指紋的數(shù)量,降低了數(shù)字指紋密度,從而降低了相似度計算時的計算量,提高了文本相似度檢測的檢測速度。 |
