一種面向開放領域的細粒度知識抽取方法

基本信息

申請?zhí)?/td> CN202210313413.X 申請日 -
公開(公告)號 CN114676265A 公開(公告)日 2022-06-28
申請公布號 CN114676265A 申請公布日 2022-06-28
分類號 G06F16/36(2019.01)I;G06F16/35(2019.01)I;G06F16/953(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 胡靜遠;劉洪強;沈翀 申請(專利權)人 南通海賽未來數(shù)字科技有限公司
代理機構 南通云創(chuàng)慧泉專利代理事務所(普通合伙) 代理人 -
地址 215000江蘇省蘇州市高新區(qū)昆侖山路58號1幢
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種面向開放領域的細粒度知識抽取方法,涉及計算機技術領域。該面向開放領域的細粒度知識抽取方法,包括獲取初級領域庫本體,根據(jù)現(xiàn)有開放知識圖譜確定初級領域庫本體中各個初級領域類型;通過所述初級領域庫本體。本發(fā)明,采用DBpedia、Yago、Wikidata、BabelNet、ConceptNet以及MicrosoftConceptGraph、OpenKG中至少三種共用作為開放知識圖譜,可以大大緩解現(xiàn)有技術中在對知識元提取時,存在對領域專家知識依賴性強的問題,通過對當前領域類型的語義標簽與上一輪領域類型的語義標簽反復對比,直到達到相應的條件,使得建立的三級領域類型、三級標注詞庫和三級標注語料庫更加準確,避免了語義模糊不清的問題,提高了知識抽取的準確率。