一種組合新聞分析基于多篇資訊的內(nèi)容檢索方法

基本信息

申請(qǐng)?zhí)?/td> CN201610920381.4 申請(qǐng)日 -
公開(公告)號(hào) CN107066461A 公開(公告)日 2017-08-18
申請(qǐng)公布號(hào) CN107066461A 申請(qǐng)公布日 2017-08-18
分類號(hào) G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李學(xué)良 申請(qǐng)(專利權(quán))人 天津海量信息技術(shù)股份有限公司
代理機(jī)構(gòu) - 代理人 -
地址 300000 天津市濱海新區(qū)華苑產(chǎn)業(yè)區(qū)榕苑路1號(hào)B北322-323室
法律狀態(tài) -

摘要

摘要 一種組合新聞分析基于多篇資訊的內(nèi)容檢索方法,其特征在于:包括步驟一,將多篇資訊url組合到一起;作為要評(píng)估的輸入項(xiàng);步驟二,根據(jù)這些url對(duì)數(shù)據(jù)進(jìn)行召回;首先獲取url對(duì)應(yīng)資訊的md5;根據(jù)獲取到的這一批md5進(jìn)行數(shù)據(jù)召回;每條url對(duì)應(yīng)資訊最多有十條md5,如果對(duì)五個(gè)url進(jìn)行組合評(píng)估,就將這五條url的md5都獲取過來,進(jìn)行召回?cái)?shù)據(jù);步驟三,對(duì)召回的數(shù)據(jù)通過歸堆算法進(jìn)行歸堆;步驟四,將歸堆后新聞進(jìn)行評(píng)估分析,響應(yīng)給用戶。