通用文本解析架構(gòu)及基于所述架構(gòu)解析文本的方法和裝置
基本信息
申請?zhí)?/td> | CN201611249460.3 | 申請日 | - |
公開(公告)號 | CN108255802B | 公開(公告)日 | 2021-08-24 |
申請公布號 | CN108255802B | 申請公布日 | 2021-08-24 |
分類號 | G06F40/211;G06F40/253;G06F40/284 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 石鵬;姜珂 | 申請(專利權(quán))人 | 北京國雙科技有限公司 |
代理機(jī)構(gòu) | 北京鼎佳達(dá)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 王偉鋒;劉鐵生 |
地址 | 100083 北京市海淀區(qū)北四環(huán)中路229號海泰大廈4層南401號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開一種通用文本解析架構(gòu)及基于所述架構(gòu)解析文本的方法和裝置,涉及數(shù)據(jù)分析技術(shù)領(lǐng)域,能夠提高開發(fā)完整文本解析程序的效率。架構(gòu)中的預(yù)處理層用于提供組件化的預(yù)處理邏輯,在基于預(yù)處理邏輯獲得預(yù)處理組件后,利用預(yù)處理組件對文本進(jìn)行預(yù)處理,并將預(yù)處理結(jié)果傳輸至語料倉庫層進(jìn)行緩存;信息搜索算法層用于提供對公共算法進(jìn)行封裝的信息搜索邏輯,并在基于信息搜索邏輯獲得封裝的算法后,將算法進(jìn)行緩存,預(yù)處理組件和/或算法有熱插拔性;維度業(yè)務(wù)邏輯層用于通過調(diào)用信息搜索算法層中的算法,實(shí)現(xiàn)對語料倉庫層中緩存的預(yù)處理結(jié)果的搜索,并通過維度業(yè)務(wù)邏輯對搜索結(jié)果進(jìn)行處理獲得文本解析結(jié)果。主要適用于開發(fā)文本解析程序的場景中。 |
