關(guān)鍵信息提取模型及其構(gòu)建方法
基本信息
申請?zhí)?/td> | CN201810681052.8 | 申請日 | - |
公開(公告)號 | CN110728139A | 公開(公告)日 | 2020-01-24 |
申請公布號 | CN110728139A | 申請公布日 | 2020-01-24 |
分類號 | G06F40/284;G06N3/04;G06Q40/02 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 王旭;韓中華;吳雪軍 | 申請(專利權(quán))人 | 鼎復(fù)數(shù)據(jù)科技(北京)有限公司 |
代理機(jī)構(gòu) | 北京康思博達(dá)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 鼎復(fù)數(shù)據(jù)科技(北京)有限公司 |
地址 | 100020 北京市朝陽區(qū)北辰世紀(jì)中心A座1550 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種關(guān)鍵信息提取模型及其構(gòu)建方法,該方法中,需要從特定文檔中提取包含關(guān)鍵詞的基礎(chǔ)樣本;再判斷并標(biāo)注所述基礎(chǔ)樣本中記載內(nèi)容對應(yīng)的關(guān)鍵信息類別,在對所述基礎(chǔ)樣本做分詞處理后,搭建CNN神經(jīng)網(wǎng)絡(luò),訓(xùn)練基礎(chǔ)樣本,得到關(guān)鍵信息提取模型,其中關(guān)鍵信息提取模型的輸入包括每個(gè)詞的詞向量、該詞與關(guān)鍵詞的相對位置向量、該詞的實(shí)體類型向量,還要將對應(yīng)的標(biāo)題作為輸入,從而進(jìn)一步提升模型準(zhǔn)確率。 |
