一種基于公開數(shù)據(jù)的新型搜索方法

基本信息

申請?zhí)?/td> CN202010169574.7 申請日 -
公開(公告)號 CN111339391A 公開(公告)日 2020-06-26
申請公布號 CN111339391A 申請公布日 2020-06-26
分類號 G06F16/951(2019.01)I 分類 -
發(fā)明人 李林亮;張盛澤;王娟 申請(專利權(quán))人 南京安鏈數(shù)據(jù)科技有限公司
代理機(jī)構(gòu) 北京中企鴻陽知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 南京安鏈數(shù)據(jù)科技有限公司
地址 210000江蘇省南京市雨花臺區(qū)軟件大道106號2棟1樓東側(cè)1131
法律狀態(tài) -

摘要

摘要 本發(fā)明提出了一種基于公開數(shù)據(jù)的新型搜索方法,包括:根據(jù)預(yù)先整理的詞條信息,在互聯(lián)網(wǎng)上爬取與詞條信息對應(yīng)的內(nèi)容及實(shí)體關(guān)聯(lián)的多媒體數(shù)據(jù),并分析得到該詞條信息的屬性列表和實(shí)體關(guān)聯(lián)的多媒體列表;采用jena工具進(jìn)行數(shù)據(jù)建模,以對同一類別的詞條的屬性進(jìn)行合并,再根據(jù)合并后的屬性的內(nèi)容,分析得到詞條之間的關(guān)系;對檢索服務(wù)數(shù)據(jù)進(jìn)行初始化,采用NLP工具對查詢語句進(jìn)行語義分析,對模糊的語句進(jìn)行分詞識別,根據(jù)分詞結(jié)果在WEB搜索服務(wù)頁面上進(jìn)行關(guān)鍵字檢索,返回檢索結(jié)果。本發(fā)明不僅支持傳統(tǒng)的關(guān)鍵字內(nèi)容檢索,還支持圖片檢索、語義檢索、條件檢索,并且能夠通過圖譜詳細(xì)的展現(xiàn)實(shí)體與關(guān)系圖,使得數(shù)據(jù)檢索功能更強(qiáng)大。??