基于對比學(xué)習(xí)的文檔關(guān)系抽取方法及其相關(guān)設(shè)備

基本信息

申請?zhí)?/td> CN202111415292.1 申請日 -
公開(公告)號 CN114090792A 公開(公告)日 2022-02-25
申請公布號 CN114090792A 申請公布日 2022-02-25
分類號 G06F16/36(2019.01)I;G06F40/211(2020.01)I;G06F40/289(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王偉;黃勇其;于翠翠;張黔 申請(專利權(quán))人 華潤數(shù)字科技有限公司
代理機構(gòu) 深圳市世聯(lián)合知識產(chǎn)權(quán)代理有限公司 代理人 姜妍
地址 518000廣東省深圳市福田區(qū)梅林街道梅都社區(qū)中康路136號深圳新一代產(chǎn)業(yè)園2棟801
法律狀態(tài) -

摘要

摘要 本申請實施例屬于人工智能技術(shù)領(lǐng)域,涉及一種基于對比學(xué)習(xí)的文檔關(guān)系抽取方法及其相關(guān)設(shè)備,包括基于語料文檔集合生成實體集合,基于知識庫確定實體集合的非知識庫實體;將非知識庫實體和知識庫實體輸入向量生成模型,獲得非知識庫實體表征向量和知識庫實體表征向量;確定非知識庫實體的替代實體;判斷實體集合中處于同一句子的實體是否存在關(guān)系標簽,若存在,獲取關(guān)系標簽,生成句子關(guān)系正樣本集合,若不存在,生成句子關(guān)系負樣本集合;訓(xùn)練初始特征編碼器,獲得目標特征編碼器;將待分類句子輸入目標特征編碼器,獲得表征向量,將表征向量輸入關(guān)系分類器,獲得關(guān)系分類。本申請在減少樣本標注的同時,提高關(guān)系抽取的準確性。