一種基于機(jī)器學(xué)習(xí)的版權(quán)追蹤方法

基本信息

申請(qǐng)?zhí)?/td> CN201811532787.0 申請(qǐng)日 -
公開(公告)號(hào) CN109635090A 公開(公告)日 2019-04-16
申請(qǐng)公布號(hào) CN109635090A 申請(qǐng)公布日 2019-04-16
分類號(hào) G06F16/332(2019.01)I; G06F16/951(2019.01)I; G06F21/10(2013.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王澤 申請(qǐng)(專利權(quán))人 安徽璞華物聯(lián)科技有限公司
代理機(jī)構(gòu) 上海精晟知識(shí)產(chǎn)權(quán)代理有限公司 代理人 安徽中船璞華科技有限公司
地址 230000 安徽省合肥市高新區(qū)習(xí)友路3333號(hào)中國(guó)(合肥)國(guó)際智能語(yǔ)音產(chǎn)業(yè)園研發(fā)中心樓609-100
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于機(jī)器學(xué)習(xí)的版權(quán)追蹤方法,涉及網(wǎng)絡(luò)文獻(xiàn)版權(quán)追蹤技術(shù)領(lǐng)域。本發(fā)明包括:構(gòu)件神經(jīng)網(wǎng)絡(luò)主題模型,對(duì)用戶錄入文章的語(yǔ)義分析提取關(guān)鍵詞;將關(guān)鍵詞作為搜索引擎的輸入?yún)?shù),獲取搜索結(jié)果集;通過(guò)爬蟲算法,獲取搜索結(jié)果集中搜索結(jié)果對(duì)應(yīng)網(wǎng)頁(yè)中的目標(biāo)文章;通過(guò)Word2Vec算法模型計(jì)算網(wǎng)頁(yè)中的目標(biāo)文章與用戶錄入文章內(nèi)容的相似度。本發(fā)明通過(guò)獲取與預(yù)發(fā)布文章主題相似度高的關(guān)鍵字,并通過(guò)關(guān)鍵字在互聯(lián)網(wǎng)網(wǎng)站獲取與關(guān)鍵字匹配的目標(biāo)文章,最后通過(guò)文本內(nèi)容比較算法比較預(yù)發(fā)布文章與目標(biāo)文章的相似度判斷預(yù)發(fā)布文章是否存在版權(quán)侵犯,方便操作、提高互聯(lián)網(wǎng)文章版權(quán)追蹤效率并且提高預(yù)發(fā)布文章與目標(biāo)文章的相似度的準(zhǔn)確率和可信度。