新聞資訊聚合分析方法及系統(tǒng)、終端、存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202010397390.6 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN111581480A | 公開(公告)日 | 2020-08-25 |
申請(qǐng)公布號(hào) | CN111581480A | 申請(qǐng)公布日 | 2020-08-25 |
分類號(hào) | G06F16/951(2019.01)I | 分類 | - |
發(fā)明人 | 舒勝宏 | 申請(qǐng)(專利權(quán))人 | 杭州風(fēng)遠(yuǎn)科技有限公司 |
代理機(jī)構(gòu) | 上海璀匯知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 杭州風(fēng)遠(yuǎn)科技有限公司 |
地址 | 310000浙江省杭州市濱江區(qū)先鋒科技大廈901 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開一種新聞資訊聚合分析方法及系統(tǒng)、終端、存儲(chǔ)介質(zhì),其中方法主要包括:基于標(biāo)準(zhǔn)聚合接口定義的數(shù)據(jù)采集配置采集原始數(shù)據(jù),根據(jù)標(biāo)準(zhǔn)聚合接口定義的結(jié)構(gòu)化規(guī)則進(jìn)行數(shù)據(jù)聚合;根據(jù)聚合器的接口定義的結(jié)構(gòu)化規(guī)則和中文分詞技術(shù)對(duì)聚合后的數(shù)據(jù)進(jìn)行去重預(yù)處理得到結(jié)構(gòu)化數(shù)據(jù);根據(jù)結(jié)構(gòu)化數(shù)據(jù)在不同維度的定義進(jìn)行數(shù)據(jù)歸類,并輸出歸類報(bào)告。采用本發(fā)明,在數(shù)據(jù)采集聚合后,對(duì)數(shù)據(jù)進(jìn)行去重預(yù)處理再進(jìn)行分析歸類,可以為大數(shù)據(jù)分析提供便捷滿足特定需求的可持續(xù)化分析處理的過程,解決當(dāng)下新聞源雜亂、內(nèi)容結(jié)構(gòu)不統(tǒng)一、新聞資訊量巨大的采集難題。?? |
