一種增強關(guān)聯(lián)規(guī)則的隱患知識推理方法
基本信息
申請?zhí)?/td> | CN202010950614.1 | 申請日 | - |
公開(公告)號 | CN114168739A | 公開(公告)日 | 2022-03-11 |
申請公布號 | CN114168739A | 申請公布日 | 2022-03-11 |
分類號 | G06F16/36(2019.01)I;G06N5/04(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 于建友;孫建;劉明 | 申請(專利權(quán))人 | 國網(wǎng)吉林省電力有限公司白山供電公司 |
代理機構(gòu) | - | 代理人 | - |
地址 | 134300吉林省白山市八道江區(qū)長白山大街1601號(開發(fā)區(qū)) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明針對如何完善的知識圖譜并非是傳統(tǒng)意義上的結(jié)構(gòu)化的知識圖譜,而是一種基于非結(jié)構(gòu)化文本增強關(guān)聯(lián)規(guī)則的知識推理方法。由于知識圖譜中的知識易于被計算機處理,因此它在許多自然語言處理任務中都起著至關(guān)重要的作用。雖然從絕對數(shù)量來看,現(xiàn)有的知識圖譜已經(jīng)包含了海量的三元組事實,但是與真實世界中存在的知識相比它遠遠不夠?,F(xiàn)有的研究方向主要分為內(nèi)部推理和外部抽取兩類,然而這些方法仍有很大的提升空間:一方面,由于知識圖譜內(nèi)部知識存在錯誤或缺失,可能會在推理時產(chǎn)生錯誤的擴散;另一方面,現(xiàn)有的知識抽取方法主要集中于對實體類型、關(guān)系等知識的抽取,從而導致抽取的知識不夠全面。本方法從非結(jié)構(gòu)化文本表述中抽象出文本表述模式,并以詞語分布袋的形式對其進行表示,進而結(jié)合知識圖譜已有的知識構(gòu)建關(guān)聯(lián)規(guī)則。與傳統(tǒng)關(guān)聯(lián)規(guī)則的區(qū)別在于,本方法得到的關(guān)聯(lián)規(guī)則可以通過與非結(jié)構(gòu)化文本匹配的方式來完成知識推理。實驗結(jié)果表明,與傳統(tǒng)方法相比,本方法可以高效地從非結(jié)構(gòu)化文本中推理出數(shù)量更大且質(zhì)量更高的三元組知識。 |
