一種基于卷積神經(jīng)網(wǎng)絡(luò)和距離監(jiān)督的關(guān)系抽取方法

基本信息

申請?zhí)?/td> CN201610393749.6 申請日 -
公開(公告)號 CN106055675B 公開(公告)日 2019-10-29
申請公布號 CN106055675B 申請公布日 2019-10-29
分類號 G06F16/9535;G06F17/27;G06N3/02 分類 計算;推算;計數(shù);
發(fā)明人 凌立剛;朱海鵬 申請(專利權(quán))人 杭州量知數(shù)據(jù)科技有限公司
代理機(jī)構(gòu) 杭州求是專利事務(wù)所有限公司 代理人 杭州量知數(shù)據(jù)科技有限公司
地址 310013 浙江省杭州市西湖區(qū)西溪路525號C樓492室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于卷積神經(jīng)網(wǎng)絡(luò)和距離監(jiān)督的關(guān)系抽取方法。包括如下步驟:(1)將已有的少量關(guān)系映射成所需要的關(guān)系類型;(2)擴(kuò)展已有的關(guān)系中實(shí)體的不同表達(dá)方式;(3)從互聯(lián)網(wǎng)上獲取大量相關(guān)的非結(jié)構(gòu)化文本,并建立索引;(4)通過索引查詢與實(shí)體相關(guān)的句子,并分出正負(fù)樣本;(5)基于卷積神經(jīng)網(wǎng)絡(luò),將樣本轉(zhuǎn)換為特征向量;(6)利用獲取的特征向量,對文本進(jìn)行分類,得到新的關(guān)系對。本發(fā)明基于一個句子可能存在一種關(guān)系的假設(shè),從少量的已知關(guān)系開始,利用大量來自互聯(lián)網(wǎng)的非結(jié)構(gòu)化文本,獲取得到大量新的結(jié)構(gòu)化信息,也就是發(fā)現(xiàn)新的關(guān)系。