一種企業(yè)外部數(shù)據(jù)采集與分析系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202110372832.6 申請(qǐng)日 -
公開(公告)號(hào) CN112950293A 公開(公告)日 2021-06-11
申請(qǐng)公布號(hào) CN112950293A 申請(qǐng)公布日 2021-06-11
分類號(hào) G06Q30/02;G06F16/25;G06F16/215;G06F16/9035 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 胡楊;劉軍愷;李瑋;戴萍 申請(qǐng)(專利權(quán))人 華能四川能源開發(fā)有限公司
代理機(jī)構(gòu) 北京天奇智新知識(shí)產(chǎn)權(quán)代理有限公司 代理人 葉明博
地址 610041 四川省成都市武侯區(qū)人民南路四段47號(hào)華能大廈
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種企業(yè)外部數(shù)據(jù)采集與分析系統(tǒng),包括:用戶界面、抓取模塊、解析模塊、分析模塊與存儲(chǔ)模塊;用戶界面接收輸入?yún)?shù),通過設(shè)置諸如抓取范圍、關(guān)鍵詞等參數(shù),進(jìn)行一次過濾;抓取模塊按照參數(shù)要求從外部數(shù)據(jù)源采集數(shù)據(jù),并將采集到的數(shù)據(jù)送解析模塊處理,解析模塊將解析后的結(jié)果送分析模塊進(jìn)行比對(duì)并傳回用戶界面顯示。本發(fā)明能夠針對(duì)數(shù)據(jù)源進(jìn)行配置,依用戶所需調(diào)整字段、排列、結(jié)構(gòu)提取信息,具有更好的靈活性、全面性;不依賴第三方數(shù)據(jù)服務(wù);能夠針對(duì)不同數(shù)據(jù)源配置不同的解析方式,解決了人工監(jiān)測(cè)耗時(shí)耗力、覆蓋片面、能處理的信息量非常有限且難以跟蹤數(shù)據(jù)動(dòng)態(tài)變化問題;大幅節(jié)約了用戶尋找新信息的時(shí)間。