一種面向精準搜索的網(wǎng)站結(jié)構(gòu)化標注方法和系統(tǒng)
基本信息
申請?zhí)?/td> | CN201310244611.6 | 申請日 | - |
公開(公告)號 | CN103365961A | 公開(公告)日 | 2013-10-23 |
申請公布號 | CN103365961A | 申請公布日 | 2013-10-23 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 文小超;蘭穎峰 | 申請(專利權(quán))人 | 北京時間中國網(wǎng)科技有限公司 |
代理機構(gòu) | 北京集佳知識產(chǎn)權(quán)代理有限公司 | 代理人 | 北京時間中國網(wǎng)科技有限公司;北京點玩?zhèn)I(yè)軟件技術(shù)有限公司 |
地址 | 100089 北京市海淀區(qū)西三環(huán)北路89號中國外文大廈B座5層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及計算機技術(shù)領(lǐng)域,特別是涉及一種面向精準搜索的網(wǎng)站結(jié)構(gòu)化標注方法和系統(tǒng),所述方法包括:對互聯(lián)網(wǎng)網(wǎng)站進行抽樣采集,對獲取的網(wǎng)站采集樣本集合進行數(shù)據(jù)加工和處理以構(gòu)建基礎(chǔ)網(wǎng)站庫;利用結(jié)構(gòu)化指標對基礎(chǔ)網(wǎng)站庫中的網(wǎng)站進行標注,生成結(jié)構(gòu)化的網(wǎng)站采集樣本;接收用戶的搜索請求,根據(jù)用戶的搜索請求中攜帶的結(jié)構(gòu)化指標參數(shù)在所述結(jié)構(gòu)化的網(wǎng)站采集樣本中搜索,以獲取與所述結(jié)構(gòu)化指標參數(shù)匹配的網(wǎng)站,利用所述網(wǎng)站對應(yīng)的網(wǎng)頁地址生成信息采集入口集合。本發(fā)明實施例提供了一種網(wǎng)站結(jié)構(gòu)化標注方法和系統(tǒng),可以通過為網(wǎng)站進行結(jié)構(gòu)化標注,以提供面向精準搜索的更準確、全面的深度信息采集入口,以為用戶提供更準確、全面的深度搜索結(jié)果。 |
