基于搜索的近義詞庫(kù)更新方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202111621342.1 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN114491215A | 公開(kāi)(公告)日 | 2022-05-13 |
申請(qǐng)公布號(hào) | CN114491215A | 申請(qǐng)公布日 | 2022-05-13 |
分類(lèi)號(hào) | G06F16/953(2019.01)I;G06F16/955(2019.01)I;G06F16/36(2019.01)I;G06F16/33(2019.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 余文鋒 | 申請(qǐng)(專(zhuān)利權(quán))人 | 深圳市游迷天下科技有限公司 |
代理機(jī)構(gòu) | 深圳市恒程創(chuàng)新知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | - |
地址 | 518000廣東省深圳市福田區(qū)沙頭街道福強(qiáng)路3030號(hào)福田體育公園文化體育產(chǎn)業(yè)總部大廈8樓C區(qū) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于搜索的近義詞庫(kù)更新方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),涉及自然語(yǔ)言處理領(lǐng)域,該方法包括:獲取待對(duì)比的第一目標(biāo)詞語(yǔ)和第二目標(biāo)詞語(yǔ),生成包含第一目標(biāo)詞語(yǔ)的第一語(yǔ)句集合,以及包含第二目標(biāo)詞語(yǔ)的第二語(yǔ)句集合;基于第一語(yǔ)句集合和第二語(yǔ)句集合,計(jì)算第一目標(biāo)詞語(yǔ)和第二目標(biāo)詞語(yǔ)的特征相似度;若特征相似度大于目標(biāo)預(yù)設(shè)閾值,則獲取第一目標(biāo)詞語(yǔ)的第一網(wǎng)絡(luò)搜索結(jié)果,以及第二目標(biāo)詞語(yǔ)的第二網(wǎng)絡(luò)搜索結(jié)果,并根據(jù)第一網(wǎng)絡(luò)搜索結(jié)果和第二網(wǎng)絡(luò)搜索結(jié)果,判斷第一目標(biāo)詞語(yǔ)和第二目標(biāo)詞語(yǔ)是否為近義詞;若第一目標(biāo)詞語(yǔ)和第二目標(biāo)詞語(yǔ)是近義詞,則將第一目標(biāo)詞語(yǔ)和第二目標(biāo)詞語(yǔ)綁定至預(yù)設(shè)近義詞庫(kù),本發(fā)明提高了近義詞挖掘的準(zhǔn)確度。 |
