一種文本相似度確定方法、裝置、設(shè)備及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN201810937072.7 申請日 -
公開(公告)號 CN109145299A 公開(公告)日 2019-01-04
申請公布號 CN109145299A 申請公布日 2019-01-04
分類號 G06F17/27;G06F16/35;G06K9/62 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 史文麗;王晨光 申請(專利權(quán))人 北京金山安全軟件有限公司
代理機(jī)構(gòu) 北京柏杉松知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 北京金山安全軟件有限公司
地址 100123 北京市朝陽區(qū)姚家園南路1號惠通時(shí)代廣場8號樓
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例提供了一種文本相似度確定方法、裝置、設(shè)備及存儲介質(zhì),其中,該方法包括;確定待分析文本;對待分析文本進(jìn)行分句,得到待分析文本對應(yīng)的多個句子;針對每個句子,將該句子輸入至預(yù)先訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型,得到該句子對應(yīng)的語義特征向量,其中,神經(jīng)網(wǎng)絡(luò)模型是根據(jù)多個第一訓(xùn)練樣本以及多個第一訓(xùn)練樣本分別對應(yīng)的關(guān)聯(lián)句子訓(xùn)練得到的;根據(jù)每個句子對應(yīng)的語義特征向量,確定待分析文本對應(yīng)的特定特征向量;計(jì)算待分析文本對應(yīng)的特定特征向量之間的相似度,并將該相似度作為待分析文本之間的相似度。如此,能夠提高文本相似度確定的準(zhǔn)確度。