一種基于知識(shí)圖譜建立實(shí)體統(tǒng)一模型及實(shí)體統(tǒng)一方法

基本信息

申請(qǐng)?zhí)?/td> CN202110421927.2 申請(qǐng)日 -
公開(公告)號(hào) CN113032582A 公開(公告)日 2021-06-25
申請(qǐng)公布號(hào) CN113032582A 申請(qǐng)公布日 2021-06-25
分類號(hào) G06F16/36;G06F40/295;G06F40/30;G06N3/04;G06N3/08 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 朱安安;邱彥林;趙粉玉;俞一奇 申請(qǐng)(專利權(quán))人 杭州敘簡(jiǎn)科技股份有限公司
代理機(jī)構(gòu) 杭州浙言專利代理事務(wù)所(普通合伙) 代理人 易朝暉
地址 311121 浙江省杭州市余杭區(qū)文一西路998號(hào)海創(chuàng)園5號(hào)樓706、707室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于知識(shí)圖譜建立實(shí)體統(tǒng)一模型的方法,所述方法包括:構(gòu)建實(shí)體基于描述信息的第一訓(xùn)練數(shù)據(jù)和基于結(jié)構(gòu)信息的第二訓(xùn)練;采用所述TransH模型分別獲得所述頭實(shí)體、關(guān)系以及尾實(shí)體的結(jié)構(gòu)表示向量;采用BERT+Bi?LSTM模型對(duì)所述頭實(shí)體和所述尾實(shí)體的描述信息進(jìn)行編碼獲得描述表示向量,其中,所述BERT+Bi?LSTM模型后接CRF層對(duì)編碼進(jìn)行命名實(shí)體識(shí)別;將所述結(jié)構(gòu)表示向量與所述描述表示向量結(jié)合進(jìn)行三元組驗(yàn)證所述BERT+Bi?LSTM模型訓(xùn)練;將訓(xùn)練完成的所述BERT+Bi?LSTM模型作為實(shí)體統(tǒng)一模型。