一種基于公開數(shù)據(jù)的新型搜索方法
基本信息
申請?zhí)?/td> | CN202010169574.7 | 申請日 | - |
公開(公告)號 | CN111339391A | 公開(公告)日 | 2020-06-26 |
申請公布號 | CN111339391A | 申請公布日 | 2020-06-26 |
分類號 | G06F16/951(2019.01)I | 分類 | - |
發(fā)明人 | 李林亮;張盛澤;王娟 | 申請(專利權(quán))人 | 南京安鏈數(shù)據(jù)科技有限公司 |
代理機(jī)構(gòu) | 北京中企鴻陽知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 南京安鏈數(shù)據(jù)科技有限公司 |
地址 | 210000江蘇省南京市雨花臺區(qū)軟件大道106號2棟1樓東側(cè)1131 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提出了一種基于公開數(shù)據(jù)的新型搜索方法,包括:根據(jù)預(yù)先整理的詞條信息,在互聯(lián)網(wǎng)上爬取與詞條信息對應(yīng)的內(nèi)容及實(shí)體關(guān)聯(lián)的多媒體數(shù)據(jù),并分析得到該詞條信息的屬性列表和實(shí)體關(guān)聯(lián)的多媒體列表;采用jena工具進(jìn)行數(shù)據(jù)建模,以對同一類別的詞條的屬性進(jìn)行合并,再根據(jù)合并后的屬性的內(nèi)容,分析得到詞條之間的關(guān)系;對檢索服務(wù)數(shù)據(jù)進(jìn)行初始化,采用NLP工具對查詢語句進(jìn)行語義分析,對模糊的語句進(jìn)行分詞識別,根據(jù)分詞結(jié)果在WEB搜索服務(wù)頁面上進(jìn)行關(guān)鍵字檢索,返回檢索結(jié)果。本發(fā)明不僅支持傳統(tǒng)的關(guān)鍵字內(nèi)容檢索,還支持圖片檢索、語義檢索、條件檢索,并且能夠通過圖譜詳細(xì)的展現(xiàn)實(shí)體與關(guān)系圖,使得數(shù)據(jù)檢索功能更強(qiáng)大。?? |
