一種自動(dòng)對(duì)業(yè)務(wù)數(shù)據(jù)信息進(jìn)行處理的方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201811612300.X 申請(qǐng)日 -
公開(公告)號(hào) CN109785099A 公開(公告)日 2021-07-06
申請(qǐng)公布號(hào) CN109785099A 申請(qǐng)公布日 2021-07-06
分類號(hào) G06Q40/00;G06Q50/26;G06F9/50 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陳懿;李澤然;張澤;李浩浩;尤培海;白光佩;蘇瑞文 申請(qǐng)(專利權(quán))人 大象慧云信息技術(shù)有限公司
代理機(jī)構(gòu) 北京工信聯(lián)合知識(shí)產(chǎn)權(quán)代理有限公司 代理人 商琛
地址 100195 北京市海淀區(qū)杏石口路甲18號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種自動(dòng)對(duì)業(yè)務(wù)數(shù)據(jù)信息進(jìn)行處理的方法及系統(tǒng),包括:利用分布式計(jì)算框架mapreduce對(duì)獲取的原始業(yè)務(wù)數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,以獲取物品信息數(shù)據(jù)文件和品牌信息數(shù)據(jù)文件;按照預(yù)設(shè)的轉(zhuǎn)換規(guī)則對(duì)所述品牌信息數(shù)據(jù)文件中的字段信息進(jìn)行信息轉(zhuǎn)換,以獲取經(jīng)過信息轉(zhuǎn)換的品牌信息數(shù)據(jù)文件;將所述物品信息數(shù)據(jù)文件和經(jīng)過信息轉(zhuǎn)換的品牌信息數(shù)據(jù)文件進(jìn)行關(guān)聯(lián),并根據(jù)需求基于品牌信息進(jìn)行數(shù)據(jù)抽取,以獲取第二物品信息文件;獲取每個(gè)物品的關(guān)鍵字信息增加到所述第二物品信息文件中,并對(duì)所述關(guān)鍵字信息進(jìn)行詞性標(biāo)注;根據(jù)預(yù)設(shè)的關(guān)鍵字信息過濾規(guī)則對(duì)第二物品信息文件進(jìn)行過濾,并將經(jīng)過過濾處理的物品信息文件作為完整物品信息文件存儲(chǔ)到索引庫中。