一種安全報告文本的三元組抽取方法、裝置及電子設備

基本信息

申請?zhí)?/td> CN202110316446.5 申請日 -
公開(公告)號 CN112699665B 公開(公告)日 2021-08-27
申請公布號 CN112699665B 申請公布日 2021-08-27
分類號 G06F40/211;G06F40/289;G06F40/253;G06F40/242;G06F16/36 分類 計算;推算;計數(shù);
發(fā)明人 周子楠;董龍飛 申請(專利權(quán))人 北京創(chuàng)新智源科技有限公司
代理機構(gòu) 北京動力號知識產(chǎn)權(quán)代理有限公司 代理人 梁艷;白婉露
地址 100083 北京市海淀區(qū)中關(guān)村東路1號院8號樓三層B201D-1
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種安全報告文本的三元組抽取方法,包括:獲取安全報告文本;對安全報告文本進行分句處理;利用融合外部知識構(gòu)建的分詞和詞性標注聯(lián)合模型對分句處理的結(jié)果進行分詞處理和詞性標注,輸出分詞與詞性標注結(jié)果;基于依存句法分析方法對分詞與詞性標注結(jié)果進行句法分析,獲得其中的語法成分以及語法成分之間的關(guān)系;進行語義角色標注,獲得給定謂語的論元;輸出主謂賓形式的三元組。還公開了相應的裝置、電子設備及計算機可讀存儲介質(zhì),采用依據(jù)句法分析的方式分析安全報告文本,提取三元組,在分詞過程中,加入安全領域的專有名詞,使模型更好識別主語所在位置及長度,更好表達三元組中主謂賓含義以滿足準確進行情報分析和篩查的需求。