一種基于數(shù)據(jù)庫的文檔搜索方法和裝置

基本信息

申請?zhí)?/td> CN202010292856.6 申請日 -
公開(公告)號 CN111522905A 公開(公告)日 2020-08-11
申請公布號 CN111522905A 申請公布日 2020-08-11
分類號 G06F16/31(2019.01)I 分類 -
發(fā)明人 吳祥;樊國鵬;朱留鋒 申請(專利權(quán))人 武漢燈塔之光科技有限公司
代理機(jī)構(gòu) 深圳市六加知識產(chǎn)權(quán)代理有限公司 代理人 武漢燈塔之光科技有限公司
地址 430000湖北省武漢市東湖新技術(shù)開發(fā)區(qū)光谷大道41號現(xiàn)代·國際設(shè)計(jì)城一期2棟15層08室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及數(shù)據(jù)搜索領(lǐng)域,特別是涉及一種基于數(shù)據(jù)庫的文檔搜索方法和裝置。其主要步驟為:對數(shù)據(jù)庫中待搜索的文檔進(jìn)行采集;對采集到的每個待搜索的文檔進(jìn)行分詞,并對每個待搜索的文檔建立搜索關(guān)鍵詞與文檔之間的倒排索引;根據(jù)至少一個搜索關(guān)鍵詞,通過倒排索引對包含搜索關(guān)鍵詞的待搜索的文檔進(jìn)行查找;獲取每個文檔和搜索關(guān)鍵詞的關(guān)聯(lián)度,根據(jù)關(guān)聯(lián)度對查找到的包含有搜索關(guān)鍵詞的文檔進(jìn)行排序;將查找到的文檔根據(jù)排序后的順序進(jìn)行發(fā)布。本發(fā)明可以提高搜索速度,并為不同的用戶需求和不同的應(yīng)用場景提供適合的搜索結(jié)果的呈現(xiàn)順序。??