一種從非結(jié)構(gòu)化數(shù)據(jù)提取結(jié)構(gòu)化數(shù)據(jù)的方法

基本信息

申請(qǐng)?zhí)?/td> CN201710757615.2 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN107577460A 公開(kāi)(公告)日 2018-01-12
申請(qǐng)公布號(hào) CN107577460A 申請(qǐng)公布日 2018-01-12
分類號(hào) G06F8/34;G06F8/30;G06F8/38;G06F8/41;G06F17/30 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 耐爾;屈朝暉 申請(qǐng)(專利權(quán))人 蘇州優(yōu)圣美智能系統(tǒng)有限公司
代理機(jī)構(gòu) 北京遠(yuǎn)大卓悅知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 蘇州優(yōu)圣美智能系統(tǒng)有限公司
地址 215000 江蘇省蘇州市高新區(qū)科技城科創(chuàng)路18號(hào)綜合樓2號(hào)樓6層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)一種從非結(jié)構(gòu)化數(shù)據(jù)提取結(jié)構(gòu)化數(shù)據(jù)的方法,其包括以下步驟:建立模式庫(kù),其包括基于正則表達(dá)式編寫獲得的若干個(gè)模式;基于圖像化操作,建立一個(gè)空的解析器;獲取待解析數(shù)據(jù)中的一部分作為樣本數(shù)據(jù),了解解析需求;根據(jù)解析需求,調(diào)用至少一個(gè)模式,依次編輯分類規(guī)則和解析規(guī)則以對(duì)樣本數(shù)據(jù)分類和解析,并將分類規(guī)則和解析規(guī)則存儲(chǔ)至解析器;顯示解析規(guī)則解析的樣本數(shù)據(jù)的字段值名;在實(shí)際環(huán)境中部署所述解析器。本發(fā)明提供的從非結(jié)構(gòu)化數(shù)據(jù)提取結(jié)構(gòu)化數(shù)據(jù)的方法,解析操作基于圖形化界面,操作靈活,無(wú)需面對(duì)編程文件,利于開(kāi)發(fā)、更新與維護(hù)。