一種數(shù)據(jù)抽取方法、裝置、存儲介質(zhì)及設備

基本信息

申請?zhí)?/td> CN201910789378.7 申請日 -
公開(公告)號 CN111475641B 公開(公告)日 2021-05-14
申請公布號 CN111475641B 申請公布日 2021-05-14
分類號 G06F16/35;G06F16/36;G06Q50/02 分類 計算;推算;計數(shù);
發(fā)明人 吳文曠 申請(專利權(quán))人 北京國雙千里科技有限公司
代理機構(gòu) 北京集佳知識產(chǎn)權(quán)代理有限公司 代理人 楊華
地址 100083 北京市海淀區(qū)北四環(huán)中路229號海泰大廈4層南401號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種數(shù)據(jù)抽取方法、裝置、存儲介質(zhì)及設備,其中,方法包括:基于人工為第一組文檔中的字符添加的標簽,獲取人工標注三元組,依據(jù)預設模型從第二組文檔中識別出的三元組,確定自動標注三元組,其中,預設模型為預設的與第二組文檔的類型適配的模型,模型使用訓練數(shù)據(jù)訓練得到,訓練數(shù)據(jù)包括人工標注三元組以及第一組文檔,將人工標注三元組和自動標注三元組,作為從文檔中抽取的知識數(shù)據(jù)。本發(fā)明的方案可以提高文檔中有用信息的利用率,并且,本發(fā)明所得到的知識數(shù)據(jù)更全面。