文本事件信息提取方法、電子裝置和非易失性存儲介質(zhì)

基本信息

申請?zhí)?/td> CN201910548427.8 申請日 -
公開(公告)號 CN110321432A 公開(公告)日 2019-10-11
申請公布號 CN110321432A 申請公布日 2019-10-11
分類號 G06F16/35;G06F16/36;G06F17/27;G06N3/04 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 喬春庚;江敏;劉瑞寶 申請(專利權(quán))人 拓爾思信息技術(shù)股份有限公司
代理機(jī)構(gòu) 北京天健君律專利代理事務(wù)所(普通合伙) 代理人 拓爾思信息技術(shù)股份有限公司
地址 100088 北京市海淀區(qū)知春路6號(錦秋國際大廈)14層14B04
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于信息處理技術(shù)領(lǐng)域,為了解決現(xiàn)有技術(shù)中事件信息提取的技術(shù)方案存在準(zhǔn)確率不高的技術(shù)問題,本發(fā)明提供一種本發(fā)明第一方面提供一種文本事件信息提取方法,該方法包括:對文本進(jìn)行分詞劃分,并將分詞做向量轉(zhuǎn)換后得到詞向量,以及將詞向量輸入至神經(jīng)網(wǎng)路模型,輸出實(shí)體;基于文本格式特征定義的信息類型,按照文法定義的對應(yīng)模式規(guī)則,將文本塊中的分詞和實(shí)體按照文法定義的對應(yīng)模式規(guī)則,整理成結(jié)構(gòu)化后的文本塊;對結(jié)構(gòu)化后的文本塊進(jìn)行事件信息提取處理,使用文法定義的對應(yīng)模式規(guī)則實(shí)現(xiàn)關(guān)鍵字抽取,并把關(guān)鍵字輸出到結(jié)果模板中。因此,利用神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)與規(guī)則相結(jié)合的方式,配置事件提取模型,實(shí)現(xiàn)文本事件信息的準(zhǔn)確提取。