基于搜索的近義詞庫(kù)更新方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202111621342.1 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN114491215A 公開(kāi)(公告)日 2022-05-13
申請(qǐng)公布號(hào) CN114491215A 申請(qǐng)公布日 2022-05-13
分類(lèi)號(hào) G06F16/953(2019.01)I;G06F16/955(2019.01)I;G06F16/36(2019.01)I;G06F16/33(2019.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 余文鋒 申請(qǐng)(專(zhuān)利權(quán))人 深圳市游迷天下科技有限公司
代理機(jī)構(gòu) 深圳市恒程創(chuàng)新知識(shí)產(chǎn)權(quán)代理有限公司 代理人 -
地址 518000廣東省深圳市福田區(qū)沙頭街道福強(qiáng)路3030號(hào)福田體育公園文化體育產(chǎn)業(yè)總部大廈8樓C區(qū)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于搜索的近義詞庫(kù)更新方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),涉及自然語(yǔ)言處理領(lǐng)域,該方法包括:獲取待對(duì)比的第一目標(biāo)詞語(yǔ)和第二目標(biāo)詞語(yǔ),生成包含第一目標(biāo)詞語(yǔ)的第一語(yǔ)句集合,以及包含第二目標(biāo)詞語(yǔ)的第二語(yǔ)句集合;基于第一語(yǔ)句集合和第二語(yǔ)句集合,計(jì)算第一目標(biāo)詞語(yǔ)和第二目標(biāo)詞語(yǔ)的特征相似度;若特征相似度大于目標(biāo)預(yù)設(shè)閾值,則獲取第一目標(biāo)詞語(yǔ)的第一網(wǎng)絡(luò)搜索結(jié)果,以及第二目標(biāo)詞語(yǔ)的第二網(wǎng)絡(luò)搜索結(jié)果,并根據(jù)第一網(wǎng)絡(luò)搜索結(jié)果和第二網(wǎng)絡(luò)搜索結(jié)果,判斷第一目標(biāo)詞語(yǔ)和第二目標(biāo)詞語(yǔ)是否為近義詞;若第一目標(biāo)詞語(yǔ)和第二目標(biāo)詞語(yǔ)是近義詞,則將第一目標(biāo)詞語(yǔ)和第二目標(biāo)詞語(yǔ)綁定至預(yù)設(shè)近義詞庫(kù),本發(fā)明提高了近義詞挖掘的準(zhǔn)確度。