一種侵權(quán)數(shù)據(jù)抓取優(yōu)先級的評估方法及其網(wǎng)絡(luò)監(jiān)控系統(tǒng)

基本信息

申請?zhí)?/td> CN201911313587.0 申請日 -
公開(公告)號 CN111061983A 公開(公告)日 2020-04-24
申請公布號 CN111061983A 申請公布日 2020-04-24
分類號 G06F16/958;G06F16/951;G06F21/10;G06Q50/18 分類 計算;推算;計數(shù);
發(fā)明人 朱向軍;楊峰;汪晴川;吳冠勇 申請(專利權(quán))人 上海冠勇信息科技有限公司
代理機構(gòu) 北京中濟緯天專利代理有限公司 代理人 上海冠勇信息科技有限公司
地址 200241 上海市閔行區(qū)東川路555號乙樓A2106室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及侵權(quán)數(shù)據(jù)抓取優(yōu)先級的評估方法及其網(wǎng)絡(luò)監(jiān)控系統(tǒng),步驟包括:S1根據(jù)搜索結(jié)果獲取包括:第一興趣信息I1、第二興趣信息I2、標題S、作品信息K、關(guān)鍵詞信息K1、當前作品優(yōu)先級wl、當前關(guān)鍵詞優(yōu)先級kl、搜索結(jié)果中的頁碼p和排名ps;S2計算排名因子cp=1/(p*31+ps)*F且令min(cp)=1,cp向上取整;其中所述F為調(diào)整數(shù),以確保計算結(jié)果區(qū)間為正數(shù);S3計算作品信息相似度ws=sim(S,K),其中sim(S,K)定義為字符串K中按順序出現(xiàn)在字符串S內(nèi)的最大字符數(shù)與K包含的總字符數(shù)之比;S4計算關(guān)鍵詞相似度ks=sim(S,K1),其中sim(S,K1)定義為字符串K1中按順序出現(xiàn)在字符串S內(nèi)的最大字符數(shù)與K1包含的總字符數(shù)之比;S5相似度帶入計算cl=cp*ks*C1+cp*ws;S6計算影響力ei=I2+I1*C2;S7計算搜索結(jié)果的抓取優(yōu)先級ap=wl*C3+kl*C4+cl+C5*In(ei+1)并根據(jù)ap數(shù)值排序。