一種用于文本搜索的方法及設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202110795549.4 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113515940A 公開(kāi)(公告)日 2021-10-19
申請(qǐng)公布號(hào) CN113515940A 申請(qǐng)公布日 2021-10-19
分類號(hào) G06F40/289(2020.01)I;G06F40/216(2020.01)I;G06F40/30(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 吳鵬;王夷;張劍;李東曉;俞楠;吳翔 申請(qǐng)(專利權(quán))人 上海芯翌智能科技有限公司
代理機(jī)構(gòu) 上海百一領(lǐng)御專利代理事務(wù)所(普通合伙) 代理人 王奎宇;朱永海
地址 200080上海市虹口區(qū)海寧路137號(hào)7層(集中登記地)
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┮环N用于文本搜索的技術(shù)方案,獲取輸入文本;基于預(yù)設(shè)詞典,對(duì)輸入文本進(jìn)行預(yù)處理,以獲得候選文本集,其中的每個(gè)候選文本包含若干詞元,其中,每個(gè)詞元包含詞文本、詞文本的標(biāo)注詞性及在候選文本中的位置信息;基于候選文本集及預(yù)設(shè)語(yǔ)料庫(kù),識(shí)別用戶搜索意圖,并確定候選文本集中的相關(guān)詞元及其權(quán)重;根據(jù)用戶搜索意圖,遍歷每個(gè)候選文本進(jìn)行文本搜索,并基于相關(guān)詞元的權(quán)重及其位置信息,對(duì)獲得的搜索結(jié)果進(jìn)行評(píng)分,以獲得搜索結(jié)果集,其中每個(gè)搜索結(jié)果關(guān)聯(lián)一個(gè)第一得分;根據(jù)每個(gè)搜索結(jié)果的第一得分對(duì)搜索結(jié)果集排序,并返回排序前N個(gè)搜索結(jié)果,其中,N是預(yù)設(shè)值。本申請(qǐng)的技術(shù)方案可返回精準(zhǔn)度較高的搜索結(jié)果。