一種搜索引擎數(shù)據(jù)采集入口構(gòu)建方法和裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201310244613.5 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN103390024A | 公開(kāi)(公告)日 | 2013-11-13 |
申請(qǐng)公布號(hào) | CN103390024A | 申請(qǐng)公布日 | 2013-11-13 |
分類號(hào) | G06F17/30(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 文小超;蘭穎峰;劉凱 | 申請(qǐng)(專利權(quán))人 | 北京時(shí)間中國(guó)網(wǎng)科技有限公司 |
代理機(jī)構(gòu) | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 北京時(shí)間中國(guó)網(wǎng)科技有限公司;北京點(diǎn)玩?zhèn)I(yè)軟件技術(shù)有限公司 |
地址 | 100089 北京市海淀區(qū)西三環(huán)北路89號(hào)中國(guó)外文大廈B座5層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別是涉及一種搜索引擎數(shù)據(jù)采集入口構(gòu)建方法和裝置,所述方法包括:利用第一關(guān)鍵詞集合中的關(guān)鍵詞進(jìn)行搜索,獲取搜索結(jié)果對(duì)應(yīng)的網(wǎng)頁(yè)地址,利用所述網(wǎng)頁(yè)地址構(gòu)建初始數(shù)據(jù)采集入口集合;獲取初始數(shù)據(jù)采集入口集合中的網(wǎng)頁(yè)地址對(duì)應(yīng)的第一更新數(shù)據(jù);利用第二關(guān)鍵詞集合中的關(guān)鍵詞在所述第一更新數(shù)據(jù)中進(jìn)行搜索,獲取搜索結(jié)果對(duì)應(yīng)的網(wǎng)頁(yè)地址,利用所述網(wǎng)頁(yè)地址構(gòu)建正式數(shù)據(jù)采集入口集合;其中,所述第一關(guān)鍵詞集合以及所述第二關(guān)鍵詞集合均與預(yù)定搜索領(lǐng)域相關(guān)聯(lián)。本發(fā)明可以提供面向特定領(lǐng)域的準(zhǔn)確的、全面的深度采集入口,以為用戶提供更加準(zhǔn)確、全面的深度搜索結(jié)果。 |
