一種數(shù)據(jù)處理方法、裝置、設(shè)備及介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110053681.8 申請(qǐng)日 -
公開(公告)號(hào) CN114764443A 公開(公告)日 2022-07-19
申請(qǐng)公布號(hào) CN114764443A 申請(qǐng)公布日 2022-07-19
分類號(hào) G06F16/36(2019.01)I;G06F16/332(2019.01)I;G06F16/33(2019.01)I;G06F40/126(2020.01)I;G06F40/295(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 蔣卓 申請(qǐng)(專利權(quán))人 北京獵戶星空科技有限公司
代理機(jī)構(gòu) 北京同達(dá)信恒知識(shí)產(chǎn)權(quán)代理有限公司 代理人 -
地址 100025北京市朝陽(yáng)區(qū)姚家園南路一號(hào)惠通時(shí)代廣場(chǎng)8號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種數(shù)據(jù)處理方法、裝置、設(shè)備及介質(zhì)。由于預(yù)先訓(xùn)練有實(shí)體鏈接模型,當(dāng)確定待處理的文本數(shù)據(jù)中包含的目標(biāo)實(shí)體后,獲取每個(gè)目標(biāo)實(shí)體對(duì)應(yīng)的各條知識(shí)記錄、以及該知識(shí)記錄對(duì)應(yīng)的目標(biāo)類型。針對(duì)每條知識(shí)記錄,通過該預(yù)先訓(xùn)練完成的實(shí)體鏈接模型,直接基于該文本數(shù)據(jù)、知識(shí)記錄、以及該知識(shí)記錄對(duì)應(yīng)的目標(biāo)類型,即可確定該知識(shí)記錄是否與該文本數(shù)據(jù)中包含的目標(biāo)實(shí)體匹配,從而實(shí)現(xiàn)實(shí)體鏈接,簡(jiǎn)化了實(shí)體鏈接過程,提高了確定知識(shí)記錄是否與該文本數(shù)據(jù)中包含的目標(biāo)實(shí)體匹配的效率,且通過該實(shí)體鏈接模型可以對(duì)任一實(shí)體對(duì)應(yīng)的知識(shí)記錄進(jìn)行識(shí)別,確定該知識(shí)記錄是否與該文本數(shù)據(jù)中包含的目標(biāo)實(shí)體匹配,提高了實(shí)體鏈接的靈活性和泛化能力。