一種基于模式擴充及BERT分類的知識圖譜上下位關系識別的方法和存儲設備

基本信息

申請?zhí)?/td> CN202011258408.0 申請日 -
公開(公告)號 CN112417161A 公開(公告)日 2021-02-26
申請公布號 CN112417161A 申請公布日 2021-02-26
分類號 G06F40/295(2020.01)I;G06N3/04(2006.01)I;G06F16/36(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 蘇江文;宋立華;王秋琳 申請(專利權)人 福建億榕信息技術有限公司
代理機構 福州市景弘專利代理事務所(普通合伙) 代理人 魏小霞;林祥翔
地址 350000福建省福州市鼓樓區(qū)軟件大道89號G區(qū)20號樓
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及文本識別技術領域,特別涉及一種基于模式擴充及BERT分類的知識圖譜上下位關系識別的方法和存儲設備。所述一種基于模式擴充及BERT分類的知識圖譜上下位關系識別的方法,包括步驟:基于模式擴充從外部數(shù)據(jù)中抽取潛在的上下位關系對,并結合預設資源庫形成上下位關系模型訓練種子語料;獲取待預測上下位關系數(shù)據(jù)集,基于BERT?Attention?Bi?LSTM模型對待預測數(shù)據(jù)集進行預測,得上下位關系預測結果;通過預設規(guī)則對所述上下位關系預測結果進一步處理得最終的上下位關系預測結果。該方法大大降低了規(guī)則編制的復雜性及人工投入,同時相對于另外一種主流的基于統(tǒng)計的上下位概念識別方法,具備更強的可實現(xiàn)性,能為各類專業(yè)知識圖譜的構建提供技術支撐。??