一種產(chǎn)業(yè)知識庫自動構建方法、裝置及存儲介質
基本信息
申請?zhí)?/td> | CN202011064551.6 | 申請日 | - |
公開(公告)號 | CN112307153A | 公開(公告)日 | 2021-02-02 |
申請公布號 | CN112307153A | 申請公布日 | 2021-02-02 |
分類號 | G06F16/31(2019.01)I; | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 宗暢;王云飛;楊彥飛;許克明;邵健 | 申請(專利權)人 | 杭州量知數(shù)據(jù)科技有限公司 |
代理機構 | 杭州求是專利事務所有限公司 | 代理人 | 傅朝棟;張法高 |
地址 | 310000浙江省杭州市蕭山區(qū)經(jīng)濟技術開發(fā)區(qū)明星路371號1幢601室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種產(chǎn)業(yè)知識庫自動構建方法、裝置及存儲介質。本發(fā)明在梳理出產(chǎn)業(yè)領域概念體系的前提下,針對不同類型的數(shù)據(jù)來源,利用模型、規(guī)則、詞典等先驗知識,對企業(yè)、人才等核心實體類型及其之間的關系進行高效構建,并支持對知識的按需批量更新;此外,針對產(chǎn)業(yè)資訊等非結構化文檔數(shù)據(jù),利用深度學習與規(guī)則相結合的方法,對文檔本身進行碎片化和語義標引,對核心事件類型進行面向主體的細粒度事件抽取,并通過設計標準化文本信息抽取數(shù)據(jù)結構解決各處理階段輸出的服務及其之間的通信問題;進一步通過基于上下文的實體鏈接技術,實現(xiàn)對企業(yè)和人才等核心實體的動態(tài)事件獲取,并輔助指導更新已有知識,進一步豐富產(chǎn)業(yè)知識維度。?? |
