一種用于文本搜索的方法及設(shè)備
基本信息
申請?zhí)?/td> | CN202110795549.4 | 申請日 | - |
公開(公告)號 | CN113515940A | 公開(公告)日 | 2021-10-19 |
申請公布號 | CN113515940A | 申請公布日 | 2021-10-19 |
分類號 | G06F40/289(2020.01)I;G06F40/216(2020.01)I;G06F40/30(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 吳鵬;王夷;張劍;李東曉;俞楠;吳翔 | 申請(專利權(quán))人 | 上海芯翌智能科技有限公司 |
代理機(jī)構(gòu) | 上海百一領(lǐng)御專利代理事務(wù)所(普通合伙) | 代理人 | 王奎宇;朱永海 |
地址 | 200080上海市虹口區(qū)海寧路137號7層(集中登記地) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請?zhí)峁┮环N用于文本搜索的技術(shù)方案,獲取輸入文本;基于預(yù)設(shè)詞典,對輸入文本進(jìn)行預(yù)處理,以獲得候選文本集,其中的每個候選文本包含若干詞元,其中,每個詞元包含詞文本、詞文本的標(biāo)注詞性及在候選文本中的位置信息;基于候選文本集及預(yù)設(shè)語料庫,識別用戶搜索意圖,并確定候選文本集中的相關(guān)詞元及其權(quán)重;根據(jù)用戶搜索意圖,遍歷每個候選文本進(jìn)行文本搜索,并基于相關(guān)詞元的權(quán)重及其位置信息,對獲得的搜索結(jié)果進(jìn)行評分,以獲得搜索結(jié)果集,其中每個搜索結(jié)果關(guān)聯(lián)一個第一得分;根據(jù)每個搜索結(jié)果的第一得分對搜索結(jié)果集排序,并返回排序前N個搜索結(jié)果,其中,N是預(yù)設(shè)值。本申請的技術(shù)方案可返回精準(zhǔn)度較高的搜索結(jié)果。 |
