關(guān)鍵信息提取模型及其構(gòu)建方法

基本信息

申請?zhí)?/td> CN201810681052.8 申請日 -
公開(公告)號 CN110728139A 公開(公告)日 2020-01-24
申請公布號 CN110728139A 申請公布日 2020-01-24
分類號 G06F40/284;G06N3/04;G06Q40/02 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王旭;韓中華;吳雪軍 申請(專利權(quán))人 鼎復(fù)數(shù)據(jù)科技(北京)有限公司
代理機(jī)構(gòu) 北京康思博達(dá)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 鼎復(fù)數(shù)據(jù)科技(北京)有限公司
地址 100020 北京市朝陽區(qū)北辰世紀(jì)中心A座1550
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種關(guān)鍵信息提取模型及其構(gòu)建方法,該方法中,需要從特定文檔中提取包含關(guān)鍵詞的基礎(chǔ)樣本;再判斷并標(biāo)注所述基礎(chǔ)樣本中記載內(nèi)容對應(yīng)的關(guān)鍵信息類別,在對所述基礎(chǔ)樣本做分詞處理后,搭建CNN神經(jīng)網(wǎng)絡(luò),訓(xùn)練基礎(chǔ)樣本,得到關(guān)鍵信息提取模型,其中關(guān)鍵信息提取模型的輸入包括每個(gè)詞的詞向量、該詞與關(guān)鍵詞的相對位置向量、該詞的實(shí)體類型向量,還要將對應(yīng)的標(biāo)題作為輸入,從而進(jìn)一步提升模型準(zhǔn)確率。