一種基于卷積神經(jīng)網(wǎng)絡(luò)和距離監(jiān)督的關(guān)系抽取方法
基本信息
申請?zhí)?/td> | CN201610393749.6 | 申請日 | - |
公開(公告)號 | CN106055675A | 公開(公告)日 | 2016-10-26 |
申請公布號 | CN106055675A | 申請公布日 | 2016-10-26 |
分類號 | G06F17/30(2006.01)I;G06F17/27(2006.01)I;G06N3/02(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 凌立剛;朱海鵬 | 申請(專利權(quán))人 | 杭州量知數(shù)據(jù)科技有限公司 |
代理機(jī)構(gòu) | 杭州求是專利事務(wù)所有限公司 | 代理人 | 杭州量知數(shù)據(jù)科技有限公司 |
地址 | 310013 浙江省杭州市西湖區(qū)西溪路525號C樓492室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于卷積神經(jīng)網(wǎng)絡(luò)和距離監(jiān)督的關(guān)系抽取方法。包括如下步驟:(1)將已有的少量關(guān)系映射成所需要的關(guān)系類型;(2)擴(kuò)展已有的關(guān)系中實(shí)體的不同表達(dá)方式;(3)從互聯(lián)網(wǎng)上獲取大量相關(guān)的非結(jié)構(gòu)化文本,并建立索引;(4)通過索引查詢與實(shí)體相關(guān)的句子,并分出正負(fù)樣本;(5)基于卷積神經(jīng)網(wǎng)絡(luò),將樣本轉(zhuǎn)換為特征向量;(6)利用獲取的特征向量,對文本進(jìn)行分類,得到新的關(guān)系對。本發(fā)明基于一個(gè)句子可能存在一種關(guān)系的假設(shè),從少量的已知關(guān)系開始,利用大量來自互聯(lián)網(wǎng)的非結(jié)構(gòu)化文本,獲取得到大量新的結(jié)構(gòu)化信息,也就是發(fā)現(xiàn)新的關(guān)系。 |
