新聞素材的采集方法及裝置、存儲(chǔ)介質(zhì)、電子裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202110292933.2 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113177117A | 公開(kāi)(公告)日 | 2021-07-27 |
申請(qǐng)公布號(hào) | CN113177117A | 申請(qǐng)公布日 | 2021-07-27 |
分類號(hào) | G06F16/34;G06F16/33;G06F40/295;G06N3/04;G06N3/08 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 程剛;張劍;王昕;黃仁杰 | 申請(qǐng)(專利權(quán))人 | 深圳市北科瑞訊信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 深圳智匯遠(yuǎn)見(jiàn)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 牛悅涵;杜亞明 |
地址 | 518000 廣東省深圳市南山區(qū)高新區(qū)南區(qū)深港產(chǎn)學(xué)研基地大樓東座五樓E502-C室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種新聞素材的采集方法及裝置、存儲(chǔ)介質(zhì)、電子裝置,其中,該方法包括:采用限制來(lái)源的方式從指定數(shù)據(jù)源采集目標(biāo)主題的第一新聞源數(shù)據(jù);提取所述第一新聞源數(shù)據(jù)中的第一關(guān)鍵詞集合,并基于所述第一關(guān)鍵詞集合采用非限制來(lái)源的方式從搜索引擎采集第二新聞源數(shù)據(jù);提取所述第二新聞源數(shù)據(jù)中的第二關(guān)鍵詞集合;根據(jù)所述第一關(guān)鍵詞集和所述第二關(guān)鍵詞集合生成所述目標(biāo)主題的新聞素材。通過(guò)本發(fā)明,解決了相關(guān)技術(shù)采集新聞素材的準(zhǔn)確率低的技術(shù)問(wèn)題,同時(shí)提高了多源文本數(shù)據(jù)的采集效率,降低了新聞數(shù)據(jù)的冗余度。 |
