一種產(chǎn)業(yè)知識庫自動構(gòu)建方法、裝置及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202011064551.6 申請日 -
公開(公告)號 CN112307153A 公開(公告)日 2021-02-02
申請公布號 CN112307153A 申請公布日 2021-02-02
分類號 G06F16/31(2019.01)I; 分類 計算;推算;計數(shù);
發(fā)明人 宗暢;王云飛;楊彥飛;許克明;邵健 申請(專利權(quán))人 杭州量知數(shù)據(jù)科技有限公司
代理機(jī)構(gòu) 杭州求是專利事務(wù)所有限公司 代理人 傅朝棟;張法高
地址 310000浙江省杭州市蕭山區(qū)經(jīng)濟(jì)技術(shù)開發(fā)區(qū)明星路371號1幢601室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種產(chǎn)業(yè)知識庫自動構(gòu)建方法、裝置及存儲介質(zhì)。本發(fā)明在梳理出產(chǎn)業(yè)領(lǐng)域概念體系的前提下,針對不同類型的數(shù)據(jù)來源,利用模型、規(guī)則、詞典等先驗知識,對企業(yè)、人才等核心實體類型及其之間的關(guān)系進(jìn)行高效構(gòu)建,并支持對知識的按需批量更新;此外,針對產(chǎn)業(yè)資訊等非結(jié)構(gòu)化文檔數(shù)據(jù),利用深度學(xué)習(xí)與規(guī)則相結(jié)合的方法,對文檔本身進(jìn)行碎片化和語義標(biāo)引,對核心事件類型進(jìn)行面向主體的細(xì)粒度事件抽取,并通過設(shè)計標(biāo)準(zhǔn)化文本信息抽取數(shù)據(jù)結(jié)構(gòu)解決各處理階段輸出的服務(wù)及其之間的通信問題;進(jìn)一步通過基于上下文的實體鏈接技術(shù),實現(xiàn)對企業(yè)和人才等核心實體的動態(tài)事件獲取,并輔助指導(dǎo)更新已有知識,進(jìn)一步豐富產(chǎn)業(yè)知識維度。??