一種內(nèi)容搜索方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201910270479.3 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN109992647B 公開(kāi)(公告)日 2021-11-12
申請(qǐng)公布號(hào) CN109992647B 申請(qǐng)公布日 2021-11-12
分類(lèi)號(hào) G06F16/33(2019.01)I;G06F40/30(2020.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 任寧;盧彥博;晉耀紅;李德彥 申請(qǐng)(專(zhuān)利權(quán))人 鼎富智能科技有限公司
代理機(jī)構(gòu) 北京弘權(quán)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 逯長(zhǎng)明;許偉群
地址 100089 北京市海淀區(qū)萬(wàn)泉莊路28號(hào)萬(wàn)柳新貴大廈A座6層630室
法律狀態(tài) -

摘要

摘要 本申請(qǐng)實(shí)施例提供了一種內(nèi)容搜索方法及裝置,能夠解析用戶輸入的搜索表達(dá)式,以獲取搜索表達(dá)式包含的關(guān)鍵字和距離約束條件;根據(jù)關(guān)鍵字從預(yù)處理的語(yǔ)料中獲取包含任意關(guān)鍵字的文章,得到文章集合;從文章集合中遍歷獲取同時(shí)包含所有關(guān)鍵字的句子,得到第一句子集合;根據(jù)搜索表達(dá)式對(duì)關(guān)鍵字形成的順序約束條件,從第一句子集合中獲取滿足順序約束條件的句子,得到第二句子集合;從第二句子集合中獲取滿足距離約束條件的句子,作為搜索目標(biāo)句。由此,通過(guò)對(duì)語(yǔ)料進(jìn)行層層過(guò)濾,使篩選過(guò)后的語(yǔ)料在語(yǔ)義上逐漸收斂,使最終得到搜索目標(biāo)句在語(yǔ)義層面具有一致性。另外,通過(guò)對(duì)語(yǔ)料的層層過(guò)濾,逐漸縮小了語(yǔ)料規(guī)模,還提高了語(yǔ)料搜索速度和效率。