一種數(shù)據(jù)抽取方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN201910789378.7 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN111475641A | 公開(kāi)(公告)日 | 2020-07-31 |
申請(qǐng)公布號(hào) | CN111475641A | 申請(qǐng)公布日 | 2020-07-31 |
分類(lèi)號(hào) | G06F16/35;G06F16/36;G06Q50/02 | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 吳文曠 | 申請(qǐng)(專(zhuān)利權(quán))人 | 北京國(guó)雙千里科技有限公司 |
代理機(jī)構(gòu) | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 楊華 |
地址 | 100083 北京市海淀區(qū)北四環(huán)中路229號(hào)海泰大廈4層南401號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種數(shù)據(jù)抽取方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備,其中,方法包括:基于人工為第一組文檔中的字符添加的標(biāo)簽,獲取人工標(biāo)注三元組,依據(jù)預(yù)設(shè)模型從第二組文檔中識(shí)別出的三元組,確定自動(dòng)標(biāo)注三元組,其中,預(yù)設(shè)模型為預(yù)設(shè)的與第二組文檔的類(lèi)型適配的模型,模型使用訓(xùn)練數(shù)據(jù)訓(xùn)練得到,訓(xùn)練數(shù)據(jù)包括人工標(biāo)注三元組以及第一組文檔,將人工標(biāo)注三元組和自動(dòng)標(biāo)注三元組,作為從文檔中抽取的知識(shí)數(shù)據(jù)。本發(fā)明的方案可以提高文檔中有用信息的利用率,并且,本發(fā)明所得到的知識(shí)數(shù)據(jù)更全面。 |
