基于句法樹和圖注意力機(jī)制的實(shí)體關(guān)系抽取方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202110521529.8 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113255320A | 公開(公告)日 | 2021-08-13 |
申請(qǐng)公布號(hào) | CN113255320A | 申請(qǐng)公布日 | 2021-08-13 |
分類號(hào) | G06F40/211;G06F40/253;G06F40/289;G06F40/295;G06F40/30;G06N3/04 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張紅巖;張偉;張宇;王垚;高雁平 | 申請(qǐng)(專利權(quán))人 | 北京熙紫智數(shù)科技有限公司 |
代理機(jī)構(gòu) | 北京合縱慧信知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 蒙海云;湯建武 |
地址 | 100088 北京市西城區(qū)新街口外大街普天德勝大廈A座3層303 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種計(jì)算機(jī)技術(shù)領(lǐng)域,是一種基于句法樹和圖注意力機(jī)制的實(shí)體關(guān)系抽取方法及裝置,前者包括對(duì)文本進(jìn)行文本分析,其中文本分析包括分詞及詞性分析和依存分析;對(duì)分詞及詞性分析后的文本進(jìn)行實(shí)體識(shí)別,標(biāo)記其中的實(shí)體所在位置和實(shí)體類型;獲得待抽取文本,并輸入至關(guān)系抽取模型中抽取關(guān)系,獲得關(guān)系與句子里實(shí)體組合的三元組輸出,其中關(guān)系抽取模型為包括Bi?GRU網(wǎng)絡(luò)層、改進(jìn)GAT層和雙粒度注意力層的關(guān)系抽取模型。本發(fā)明能夠同時(shí)利用句子中的語義和語法的信息,提高了算法的性能;采用改進(jìn)GAT充分利用依存樹,學(xué)習(xí)句子語法信息的同時(shí),考慮了有效句法信息的范圍,控制了網(wǎng)絡(luò)參數(shù)的規(guī)模,提高了運(yùn)行的效率。 |
