數(shù)據(jù)標(biāo)注方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110647704.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113239205A 公開(kāi)(公告)日 2021-08-10
申請(qǐng)公布號(hào) CN113239205A 申請(qǐng)公布日 2021-08-10
分類號(hào) G06F16/35(2019.01)I;G06F16/45(2019.01)I;G06F40/30(2020.01)I;G06F16/215(2019.01)N;G06F16/25(2019.01)N 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 史祎凡;杜新凱;呂超;蔡巖松 申請(qǐng)(專利權(quán))人 陽(yáng)光保險(xiǎn)集團(tuán)股份有限公司
代理機(jī)構(gòu) 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 代理人 余菲
地址 518000廣東省深圳市福田區(qū)紅荔西路7002號(hào)第一世界廣場(chǎng)A座17層
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┝艘环N數(shù)據(jù)標(biāo)注方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該方法包括:獲取包含有至少一個(gè)文本數(shù)據(jù)及文本數(shù)據(jù)對(duì)應(yīng)的第一標(biāo)注結(jié)果的第一數(shù)據(jù)集;當(dāng)?shù)谝粯?biāo)注結(jié)果的準(zhǔn)確率大于第一閾值時(shí),對(duì)第一數(shù)據(jù)集中的文本數(shù)據(jù)進(jìn)行數(shù)據(jù)擴(kuò)充得到第二數(shù)據(jù)集;針對(duì)第二數(shù)據(jù)集中的每個(gè)文本數(shù)據(jù),從該文本數(shù)據(jù)中提取出與預(yù)設(shè)的維護(hù)詞表中的關(guān)鍵詞相同的目標(biāo)詞語(yǔ),確定第二標(biāo)注結(jié)果;當(dāng)?shù)诙?biāo)注結(jié)果的準(zhǔn)確率大于第二閾值時(shí),將每個(gè)文本數(shù)據(jù)對(duì)應(yīng)的第一標(biāo)注結(jié)果和第二標(biāo)注結(jié)果的樹(shù)狀關(guān)系確定為該文本數(shù)據(jù)的目標(biāo)標(biāo)注結(jié)果。本申請(qǐng)通過(guò)對(duì)文本數(shù)據(jù)標(biāo)注第一標(biāo)注結(jié)果和第二標(biāo)注結(jié)果,并根據(jù)第一標(biāo)注結(jié)果與第二標(biāo)注結(jié)之間的樹(shù)狀關(guān)系,提高文本數(shù)據(jù)的區(qū)分度。