一種基于機器學習的侵權(quán)網(wǎng)頁判斷方法

基本信息

申請?zhí)?/td> CN201811223048.3 申請日 -
公開(公告)號 CN109408947A 公開(公告)日 2019-03-01
申請公布號 CN109408947A 申請公布日 2019-03-01
分類號 G06F17/50;G06N99/00 分類 計算;推算;計數(shù);
發(fā)明人 林俊 申請(專利權(quán))人 杭州刀豆網(wǎng)絡(luò)科技有限公司
代理機構(gòu) 杭州華知專利事務(wù)所(普通合伙) 代理人 杭州刀豆網(wǎng)絡(luò)科技有限公司
地址 310000 浙江省杭州市余杭區(qū)倉前街道良睦路1288號6號樓302-8室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于機器學習的侵權(quán)網(wǎng)頁判斷方法,包括:網(wǎng)頁源數(shù)據(jù)預處理生成訓練集和測試集;使用訓練集生成分析模型、測試集測試不同閾值下分析模型的性能指標及人工選擇最優(yōu)閾值;使用分析模型和最優(yōu)閾值對網(wǎng)頁進行分析判斷是否為侵權(quán)網(wǎng)頁。本發(fā)明解決了現(xiàn)有采用人工審核網(wǎng)頁是否侵權(quán)成本高昂、沒有統(tǒng)一審核標準導致審核緩慢的技術(shù)問題。