一種海量相似新聞查重甄選方法、系統(tǒng)及裝置

基本信息

申請?zhí)?/td> CN201711350335.6 申請日 -
公開(公告)號 CN108280127A 公開(公告)日 2018-07-13
申請公布號 CN108280127A 申請公布日 2018-07-13
分類號 G06F17/30 分類 計算;推算;計數(shù);
發(fā)明人 張毅 申請(專利權(quán))人 廣州艾媒數(shù)聚信息咨詢股份有限公司
代理機(jī)構(gòu) 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 代理人 廣州艾媒數(shù)聚信息咨詢股份有限公司
地址 510006 廣東省廣州市番禺區(qū)小谷圍街青藍(lán)街26號701房
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種海量相似新聞查重甄選方法、系統(tǒng)及裝置,方法包括:從各個新聞源中獲取新聞文章;對獲取的新聞文章進(jìn)行快速查重處理和關(guān)鍵詞查重處理,得到查重結(jié)果;將查重結(jié)果發(fā)送至編輯進(jìn)行處理。本發(fā)明通過快速查重和關(guān)鍵詞查重結(jié)合進(jìn)行新聞查重,從而在文章結(jié)構(gòu)及文章中心思想兩個層面都保證了查重的效果,在提高了查重的準(zhǔn)確性的同時,也大大提升了工作效率,有效滿足了新聞媒體行業(yè)查重的需求。本發(fā)明可廣泛應(yīng)用于新聞領(lǐng)域中。