一種產(chǎn)業(yè)知識庫自動構(gòu)建方法、裝置及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202011064551.6 | 申請日 | - |
公開(公告)號 | CN112307153A | 公開(公告)日 | 2021-02-02 |
申請公布號 | CN112307153A | 申請公布日 | 2021-02-02 |
分類號 | G06F16/31(2019.01)I; | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 宗暢;王云飛;楊彥飛;許克明;邵健 | 申請(專利權(quán))人 | 杭州量知數(shù)據(jù)科技有限公司 |
代理機(jī)構(gòu) | 杭州求是專利事務(wù)所有限公司 | 代理人 | 傅朝棟;張法高 |
地址 | 310000浙江省杭州市蕭山區(qū)經(jīng)濟(jì)技術(shù)開發(fā)區(qū)明星路371號1幢601室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種產(chǎn)業(yè)知識庫自動構(gòu)建方法、裝置及存儲介質(zhì)。本發(fā)明在梳理出產(chǎn)業(yè)領(lǐng)域概念體系的前提下,針對不同類型的數(shù)據(jù)來源,利用模型、規(guī)則、詞典等先驗知識,對企業(yè)、人才等核心實體類型及其之間的關(guān)系進(jìn)行高效構(gòu)建,并支持對知識的按需批量更新;此外,針對產(chǎn)業(yè)資訊等非結(jié)構(gòu)化文檔數(shù)據(jù),利用深度學(xué)習(xí)與規(guī)則相結(jié)合的方法,對文檔本身進(jìn)行碎片化和語義標(biāo)引,對核心事件類型進(jìn)行面向主體的細(xì)粒度事件抽取,并通過設(shè)計標(biāo)準(zhǔn)化文本信息抽取數(shù)據(jù)結(jié)構(gòu)解決各處理階段輸出的服務(wù)及其之間的通信問題;進(jìn)一步通過基于上下文的實體鏈接技術(shù),實現(xiàn)對企業(yè)和人才等核心實體的動態(tài)事件獲取,并輔助指導(dǎo)更新已有知識,進(jìn)一步豐富產(chǎn)業(yè)知識維度。?? |
