一種用于知識(shí)圖譜語義搜索的文本理解的方法
基本信息
申請(qǐng)?zhí)?/td> | CN202110870572.5 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113688233A | 公開(公告)日 | 2021-11-23 |
申請(qǐng)公布號(hào) | CN113688233A | 申請(qǐng)公布日 | 2021-11-23 |
分類號(hào) | G06F16/35;G06F16/36;G06F16/33;G06K9/62;G06N3/04 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 陳運(yùn)文;王文廣;賀夢(mèng)潔;紀(jì)達(dá)麒;桂洪冠;金克;馮佳妮;紀(jì)傳俊 | 申請(qǐng)(專利權(quán))人 | 達(dá)觀數(shù)據(jù)(蘇州)有限公司 |
代理機(jī)構(gòu) | 上海智力專利商標(biāo)事務(wù)所(普通合伙) | 代理人 | 張文玄;周濤 |
地址 | 215133 江蘇省蘇州市相城區(qū)相城大道1168號(hào)品上商業(yè)中心5幢908室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種用于知識(shí)圖譜語義搜索的文本理解的方法,針對(duì)輸入的待理解的文本,所述方法包括如下步驟:通過大規(guī)模預(yù)訓(xùn)練模型獲得文本中每個(gè)詞元的語義信息,生成語義向量;基于所述語義向量,通過卷積神經(jīng)網(wǎng)絡(luò)、實(shí)體分類用的第一softmax分類器和關(guān)系分類用的第二softmax分類器,識(shí)別出實(shí)體類型和關(guān)系類型;基于所述語義向量,通過CRF進(jìn)行序列標(biāo)注,抽取出實(shí)體;基于所述語義向量,通過Bi?LSTM模型和問句分類用的第三softmax分類器,將文本進(jìn)行分類;基于識(shí)別出的實(shí)體類型和關(guān)系類型、抽取出的實(shí)體、文本的分類結(jié)果,檢索知識(shí)圖譜獲取信息作為反饋。本發(fā)明使用統(tǒng)一的方法同時(shí)完成了四種任務(wù),使得系統(tǒng)更加簡(jiǎn)潔。 |
