一種用于文本搜索的方法及設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN202110795549.4 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113515940A | 公開(kāi)(公告)日 | 2021-10-19 |
申請(qǐng)公布號(hào) | CN113515940A | 申請(qǐng)公布日 | 2021-10-19 |
分類號(hào) | G06F40/289(2020.01)I;G06F40/216(2020.01)I;G06F40/30(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 吳鵬;王夷;張劍;李東曉;俞楠;吳翔 | 申請(qǐng)(專利權(quán))人 | 上海芯翌智能科技有限公司 |
代理機(jī)構(gòu) | 上海百一領(lǐng)御專利代理事務(wù)所(普通合伙) | 代理人 | 王奎宇;朱永海 |
地址 | 200080上海市虹口區(qū)海寧路137號(hào)7層(集中登記地) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)?zhí)峁┮环N用于文本搜索的技術(shù)方案,獲取輸入文本;基于預(yù)設(shè)詞典,對(duì)輸入文本進(jìn)行預(yù)處理,以獲得候選文本集,其中的每個(gè)候選文本包含若干詞元,其中,每個(gè)詞元包含詞文本、詞文本的標(biāo)注詞性及在候選文本中的位置信息;基于候選文本集及預(yù)設(shè)語(yǔ)料庫(kù),識(shí)別用戶搜索意圖,并確定候選文本集中的相關(guān)詞元及其權(quán)重;根據(jù)用戶搜索意圖,遍歷每個(gè)候選文本進(jìn)行文本搜索,并基于相關(guān)詞元的權(quán)重及其位置信息,對(duì)獲得的搜索結(jié)果進(jìn)行評(píng)分,以獲得搜索結(jié)果集,其中每個(gè)搜索結(jié)果關(guān)聯(lián)一個(gè)第一得分;根據(jù)每個(gè)搜索結(jié)果的第一得分對(duì)搜索結(jié)果集排序,并返回排序前N個(gè)搜索結(jié)果,其中,N是預(yù)設(shè)值。本申請(qǐng)的技術(shù)方案可返回精準(zhǔn)度較高的搜索結(jié)果。 |
