一種用于文本搜索的方法及設(shè)備

基本信息

申請?zhí)?/td> CN202110795549.4 申請日 -
公開(公告)號 CN113515940A 公開(公告)日 2021-10-19
申請公布號 CN113515940A 申請公布日 2021-10-19
分類號 G06F40/289(2020.01)I;G06F40/216(2020.01)I;G06F40/30(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 吳鵬;王夷;張劍;李東曉;俞楠;吳翔 申請(專利權(quán))人 上海芯翌智能科技有限公司
代理機(jī)構(gòu) 上海百一領(lǐng)御專利代理事務(wù)所(普通合伙) 代理人 王奎宇;朱永海
地址 200080上海市虹口區(qū)海寧路137號7層(集中登記地)
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┮环N用于文本搜索的技術(shù)方案,獲取輸入文本;基于預(yù)設(shè)詞典,對輸入文本進(jìn)行預(yù)處理,以獲得候選文本集,其中的每個候選文本包含若干詞元,其中,每個詞元包含詞文本、詞文本的標(biāo)注詞性及在候選文本中的位置信息;基于候選文本集及預(yù)設(shè)語料庫,識別用戶搜索意圖,并確定候選文本集中的相關(guān)詞元及其權(quán)重;根據(jù)用戶搜索意圖,遍歷每個候選文本進(jìn)行文本搜索,并基于相關(guān)詞元的權(quán)重及其位置信息,對獲得的搜索結(jié)果進(jìn)行評分,以獲得搜索結(jié)果集,其中每個搜索結(jié)果關(guān)聯(lián)一個第一得分;根據(jù)每個搜索結(jié)果的第一得分對搜索結(jié)果集排序,并返回排序前N個搜索結(jié)果,其中,N是預(yù)設(shè)值。本申請的技術(shù)方案可返回精準(zhǔn)度較高的搜索結(jié)果。