基于生物云平臺(tái)的文章和數(shù)據(jù)的檢索和自動(dòng)下載系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN201610687029.0 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN106354759A | 公開(kāi)(公告)日 | 2017-01-25 |
申請(qǐng)公布號(hào) | CN106354759A | 申請(qǐng)公布日 | 2017-01-25 |
分類(lèi)號(hào) | G06F17/30(2006.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 鄭洪坤;劉祖明;楊峻;張?jiān)鼋?劉東源 | 申請(qǐng)(專利權(quán))人 | 北京百邁客云科技有限公司 |
代理機(jī)構(gòu) | 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 北京百邁客云科技有限公司 |
地址 | 101300 北京市順義區(qū)南法信鎮(zhèn)順平路南法信段9號(hào)院1幢8層807室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)一種基于生物云平臺(tái)的文章和數(shù)據(jù)的檢索和自動(dòng)下載系統(tǒng),所述系統(tǒng)包括:數(shù)據(jù)下載模塊、數(shù)據(jù)解析模塊、數(shù)據(jù)存儲(chǔ)模塊、web圖形化界面模塊和數(shù)據(jù)檢索模塊。原始數(shù)據(jù)下載后,被解析成標(biāo)準(zhǔn)格式并對(duì)這些標(biāo)準(zhǔn)格式數(shù)據(jù)進(jìn)行整合,然后按照預(yù)定的分詞策略進(jìn)行分詞、建立索引并進(jìn)行存儲(chǔ),提供檢索接口。本發(fā)明通過(guò)將凌亂的原始數(shù)據(jù)按照固定的規(guī)律解析成標(biāo)準(zhǔn)格式并存儲(chǔ)到一個(gè)檢索集群中,并提供web界面供用戶進(jìn)行文章和數(shù)據(jù)的檢索、瀏覽,便于對(duì)數(shù)據(jù)進(jìn)行再次利用和研究。 |
