一種基于模式擴(kuò)充及BERT分類的知識(shí)圖譜上下位關(guān)系識(shí)別的方法和存儲(chǔ)設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN202011258408.0 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112417161A | 公開(kāi)(公告)日 | 2021-02-26 |
申請(qǐng)公布號(hào) | CN112417161A | 申請(qǐng)公布日 | 2021-02-26 |
分類號(hào) | G06F40/295(2020.01)I;G06N3/04(2006.01)I;G06F16/36(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 蘇江文;宋立華;王秋琳 | 申請(qǐng)(專利權(quán))人 | 福建億榕信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 福州市景弘專利代理事務(wù)所(普通合伙) | 代理人 | 魏小霞;林祥翔 |
地址 | 350000福建省福州市鼓樓區(qū)軟件大道89號(hào)G區(qū)20號(hào)樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及文本識(shí)別技術(shù)領(lǐng)域,特別涉及一種基于模式擴(kuò)充及BERT分類的知識(shí)圖譜上下位關(guān)系識(shí)別的方法和存儲(chǔ)設(shè)備。所述一種基于模式擴(kuò)充及BERT分類的知識(shí)圖譜上下位關(guān)系識(shí)別的方法,包括步驟:基于模式擴(kuò)充從外部數(shù)據(jù)中抽取潛在的上下位關(guān)系對(duì),并結(jié)合預(yù)設(shè)資源庫(kù)形成上下位關(guān)系模型訓(xùn)練種子語(yǔ)料;獲取待預(yù)測(cè)上下位關(guān)系數(shù)據(jù)集,基于BERT?Attention?Bi?LSTM模型對(duì)待預(yù)測(cè)數(shù)據(jù)集進(jìn)行預(yù)測(cè),得上下位關(guān)系預(yù)測(cè)結(jié)果;通過(guò)預(yù)設(shè)規(guī)則對(duì)所述上下位關(guān)系預(yù)測(cè)結(jié)果進(jìn)一步處理得最終的上下位關(guān)系預(yù)測(cè)結(jié)果。該方法大大降低了規(guī)則編制的復(fù)雜性及人工投入,同時(shí)相對(duì)于另外一種主流的基于統(tǒng)計(jì)的上下位概念識(shí)別方法,具備更強(qiáng)的可實(shí)現(xiàn)性,能為各類專業(yè)知識(shí)圖譜的構(gòu)建提供技術(shù)支撐。?? |
