一種面向精準搜索的網(wǎng)站結(jié)構(gòu)化標注方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN201310244611.6 申請日 -
公開(公告)號 CN103365961A 公開(公告)日 2013-10-23
申請公布號 CN103365961A 申請公布日 2013-10-23
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 文小超;蘭穎峰 申請(專利權(quán))人 北京時間中國網(wǎng)科技有限公司
代理機構(gòu) 北京集佳知識產(chǎn)權(quán)代理有限公司 代理人 北京時間中國網(wǎng)科技有限公司;北京點玩?zhèn)I(yè)軟件技術(shù)有限公司
地址 100089 北京市海淀區(qū)西三環(huán)北路89號中國外文大廈B座5層
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及計算機技術(shù)領(lǐng)域,特別是涉及一種面向精準搜索的網(wǎng)站結(jié)構(gòu)化標注方法和系統(tǒng),所述方法包括:對互聯(lián)網(wǎng)網(wǎng)站進行抽樣采集,對獲取的網(wǎng)站采集樣本集合進行數(shù)據(jù)加工和處理以構(gòu)建基礎(chǔ)網(wǎng)站庫;利用結(jié)構(gòu)化指標對基礎(chǔ)網(wǎng)站庫中的網(wǎng)站進行標注,生成結(jié)構(gòu)化的網(wǎng)站采集樣本;接收用戶的搜索請求,根據(jù)用戶的搜索請求中攜帶的結(jié)構(gòu)化指標參數(shù)在所述結(jié)構(gòu)化的網(wǎng)站采集樣本中搜索,以獲取與所述結(jié)構(gòu)化指標參數(shù)匹配的網(wǎng)站,利用所述網(wǎng)站對應(yīng)的網(wǎng)頁地址生成信息采集入口集合。本發(fā)明實施例提供了一種網(wǎng)站結(jié)構(gòu)化標注方法和系統(tǒng),可以通過為網(wǎng)站進行結(jié)構(gòu)化標注,以提供面向精準搜索的更準確、全面的深度信息采集入口,以為用戶提供更準確、全面的深度搜索結(jié)果。