一種用于知識(shí)圖譜語義搜索的文本理解的方法

基本信息

申請(qǐng)?zhí)?/td> CN202110870572.5 申請(qǐng)日 -
公開(公告)號(hào) CN113688233A 公開(公告)日 2021-11-23
申請(qǐng)公布號(hào) CN113688233A 申請(qǐng)公布日 2021-11-23
分類號(hào) G06F16/35;G06F16/36;G06F16/33;G06K9/62;G06N3/04 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陳運(yùn)文;王文廣;賀夢(mèng)潔;紀(jì)達(dá)麒;桂洪冠;金克;馮佳妮;紀(jì)傳俊 申請(qǐng)(專利權(quán))人 達(dá)觀數(shù)據(jù)(蘇州)有限公司
代理機(jī)構(gòu) 上海智力專利商標(biāo)事務(wù)所(普通合伙) 代理人 張文玄;周濤
地址 215133 江蘇省蘇州市相城區(qū)相城大道1168號(hào)品上商業(yè)中心5幢908室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種用于知識(shí)圖譜語義搜索的文本理解的方法,針對(duì)輸入的待理解的文本,所述方法包括如下步驟:通過大規(guī)模預(yù)訓(xùn)練模型獲得文本中每個(gè)詞元的語義信息,生成語義向量;基于所述語義向量,通過卷積神經(jīng)網(wǎng)絡(luò)、實(shí)體分類用的第一softmax分類器和關(guān)系分類用的第二softmax分類器,識(shí)別出實(shí)體類型和關(guān)系類型;基于所述語義向量,通過CRF進(jìn)行序列標(biāo)注,抽取出實(shí)體;基于所述語義向量,通過Bi?LSTM模型和問句分類用的第三softmax分類器,將文本進(jìn)行分類;基于識(shí)別出的實(shí)體類型和關(guān)系類型、抽取出的實(shí)體、文本的分類結(jié)果,檢索知識(shí)圖譜獲取信息作為反饋。本發(fā)明使用統(tǒng)一的方法同時(shí)完成了四種任務(wù),使得系統(tǒng)更加簡(jiǎn)潔。