一種從非結(jié)構(gòu)化數(shù)據(jù)提取結(jié)構(gòu)化數(shù)據(jù)的方法
基本信息
申請(qǐng)?zhí)?/td> | CN201710757615.2 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN107577460A | 公開(kāi)(公告)日 | 2018-01-12 |
申請(qǐng)公布號(hào) | CN107577460A | 申請(qǐng)公布日 | 2018-01-12 |
分類號(hào) | G06F8/34;G06F8/30;G06F8/38;G06F8/41;G06F17/30 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 耐爾;屈朝暉 | 申請(qǐng)(專利權(quán))人 | 蘇州優(yōu)圣美智能系統(tǒng)有限公司 |
代理機(jī)構(gòu) | 北京遠(yuǎn)大卓悅知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 蘇州優(yōu)圣美智能系統(tǒng)有限公司 |
地址 | 215000 江蘇省蘇州市高新區(qū)科技城科創(chuàng)路18號(hào)綜合樓2號(hào)樓6層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)一種從非結(jié)構(gòu)化數(shù)據(jù)提取結(jié)構(gòu)化數(shù)據(jù)的方法,其包括以下步驟:建立模式庫(kù),其包括基于正則表達(dá)式編寫獲得的若干個(gè)模式;基于圖像化操作,建立一個(gè)空的解析器;獲取待解析數(shù)據(jù)中的一部分作為樣本數(shù)據(jù),了解解析需求;根據(jù)解析需求,調(diào)用至少一個(gè)模式,依次編輯分類規(guī)則和解析規(guī)則以對(duì)樣本數(shù)據(jù)分類和解析,并將分類規(guī)則和解析規(guī)則存儲(chǔ)至解析器;顯示解析規(guī)則解析的樣本數(shù)據(jù)的字段值名;在實(shí)際環(huán)境中部署所述解析器。本發(fā)明提供的從非結(jié)構(gòu)化數(shù)據(jù)提取結(jié)構(gòu)化數(shù)據(jù)的方法,解析操作基于圖形化界面,操作靈活,無(wú)需面對(duì)編程文件,利于開(kāi)發(fā)、更新與維護(hù)。 |
