一種基于卷積神經(jīng)網(wǎng)絡(luò)和距離監(jiān)督的關(guān)系抽取方法

基本信息

申請(qǐng)?zhí)?/td> CN201610393749.6 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN106055675B 公開(kāi)(公告)日 2019-10-29
申請(qǐng)公布號(hào) CN106055675B 申請(qǐng)公布日 2019-10-29
分類(lèi)號(hào) G06F16/9535;G06F17/27;G06N3/02 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 凌立剛;朱海鵬 申請(qǐng)(專(zhuān)利權(quán))人 杭州量知數(shù)據(jù)科技有限公司
代理機(jī)構(gòu) 杭州求是專(zhuān)利事務(wù)所有限公司 代理人 杭州量知數(shù)據(jù)科技有限公司
地址 310013 浙江省杭州市西湖區(qū)西溪路525號(hào)C樓492室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于卷積神經(jīng)網(wǎng)絡(luò)和距離監(jiān)督的關(guān)系抽取方法。包括如下步驟:(1)將已有的少量關(guān)系映射成所需要的關(guān)系類(lèi)型;(2)擴(kuò)展已有的關(guān)系中實(shí)體的不同表達(dá)方式;(3)從互聯(lián)網(wǎng)上獲取大量相關(guān)的非結(jié)構(gòu)化文本,并建立索引;(4)通過(guò)索引查詢(xún)與實(shí)體相關(guān)的句子,并分出正負(fù)樣本;(5)基于卷積神經(jīng)網(wǎng)絡(luò),將樣本轉(zhuǎn)換為特征向量;(6)利用獲取的特征向量,對(duì)文本進(jìn)行分類(lèi),得到新的關(guān)系對(duì)。本發(fā)明基于一個(gè)句子可能存在一種關(guān)系的假設(shè),從少量的已知關(guān)系開(kāi)始,利用大量來(lái)自互聯(lián)網(wǎng)的非結(jié)構(gòu)化文本,獲取得到大量新的結(jié)構(gòu)化信息,也就是發(fā)現(xiàn)新的關(guān)系。