通用文本解析架構(gòu)及基于所述架構(gòu)解析文本的方法和裝置

基本信息

申請?zhí)?/td> CN201611249460.3 申請日 -
公開(公告)號 CN108255802B 公開(公告)日 2021-08-24
申請公布號 CN108255802B 申請公布日 2021-08-24
分類號 G06F40/211;G06F40/253;G06F40/284 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 石鵬;姜珂 申請(專利權(quán))人 北京國雙科技有限公司
代理機(jī)構(gòu) 北京鼎佳達(dá)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 王偉鋒;劉鐵生
地址 100083 北京市海淀區(qū)北四環(huán)中路229號海泰大廈4層南401號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種通用文本解析架構(gòu)及基于所述架構(gòu)解析文本的方法和裝置,涉及數(shù)據(jù)分析技術(shù)領(lǐng)域,能夠提高開發(fā)完整文本解析程序的效率。架構(gòu)中的預(yù)處理層用于提供組件化的預(yù)處理邏輯,在基于預(yù)處理邏輯獲得預(yù)處理組件后,利用預(yù)處理組件對文本進(jìn)行預(yù)處理,并將預(yù)處理結(jié)果傳輸至語料倉庫層進(jìn)行緩存;信息搜索算法層用于提供對公共算法進(jìn)行封裝的信息搜索邏輯,并在基于信息搜索邏輯獲得封裝的算法后,將算法進(jìn)行緩存,預(yù)處理組件和/或算法有熱插拔性;維度業(yè)務(wù)邏輯層用于通過調(diào)用信息搜索算法層中的算法,實(shí)現(xiàn)對語料倉庫層中緩存的預(yù)處理結(jié)果的搜索,并通過維度業(yè)務(wù)邏輯對搜索結(jié)果進(jìn)行處理獲得文本解析結(jié)果。主要適用于開發(fā)文本解析程序的場景中。