一種基于卷積神經(jīng)網(wǎng)絡(luò)和距離監(jiān)督的關(guān)系抽取方法
基本信息
申請(qǐng)?zhí)?/td> | CN201610393749.6 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN106055675B | 公開(kāi)(公告)日 | 2019-10-29 |
申請(qǐng)公布號(hào) | CN106055675B | 申請(qǐng)公布日 | 2019-10-29 |
分類(lèi)號(hào) | G06F16/9535;G06F17/27;G06N3/02 | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 凌立剛;朱海鵬 | 申請(qǐng)(專(zhuān)利權(quán))人 | 杭州量知數(shù)據(jù)科技有限公司 |
代理機(jī)構(gòu) | 杭州求是專(zhuān)利事務(wù)所有限公司 | 代理人 | 杭州量知數(shù)據(jù)科技有限公司 |
地址 | 310013 浙江省杭州市西湖區(qū)西溪路525號(hào)C樓492室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于卷積神經(jīng)網(wǎng)絡(luò)和距離監(jiān)督的關(guān)系抽取方法。包括如下步驟:(1)將已有的少量關(guān)系映射成所需要的關(guān)系類(lèi)型;(2)擴(kuò)展已有的關(guān)系中實(shí)體的不同表達(dá)方式;(3)從互聯(lián)網(wǎng)上獲取大量相關(guān)的非結(jié)構(gòu)化文本,并建立索引;(4)通過(guò)索引查詢(xún)與實(shí)體相關(guān)的句子,并分出正負(fù)樣本;(5)基于卷積神經(jīng)網(wǎng)絡(luò),將樣本轉(zhuǎn)換為特征向量;(6)利用獲取的特征向量,對(duì)文本進(jìn)行分類(lèi),得到新的關(guān)系對(duì)。本發(fā)明基于一個(gè)句子可能存在一種關(guān)系的假設(shè),從少量的已知關(guān)系開(kāi)始,利用大量來(lái)自互聯(lián)網(wǎng)的非結(jié)構(gòu)化文本,獲取得到大量新的結(jié)構(gòu)化信息,也就是發(fā)現(xiàn)新的關(guān)系。 |
