命名實(shí)體識(shí)別模型建立方法及命名實(shí)體識(shí)別方法

基本信息

申請(qǐng)?zhí)?/td> CN202011305077.1 申請(qǐng)日 -
公開(公告)號(hào) CN112364655B 公開(公告)日 2021-08-24
申請(qǐng)公布號(hào) CN112364655B 申請(qǐng)公布日 2021-08-24
分類號(hào) G06F40/295(2020.01)I;G06F40/242(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 周玉 申請(qǐng)(專利權(quán))人 北京中科凡語科技有限公司
代理機(jī)構(gòu) 北京庚致知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 韓德凱;李曉輝
地址 100190北京市海淀區(qū)知春路63號(hào)51號(hào)樓10層1006
法律狀態(tài) -

摘要

摘要 本公開提供一種命名實(shí)體識(shí)別模型建立方法,其包括:獲取目標(biāo)領(lǐng)域的訓(xùn)練文本集;基于所述目標(biāo)領(lǐng)域的領(lǐng)域特征構(gòu)建命名實(shí)體種類集以及文本段落類別集;基于所述文本段落類別集以及所述命名實(shí)體種類集構(gòu)建“文本段落類別?命名實(shí)體種類”映射字典;使用所述“文本段落類別?命名實(shí)體種類”映射字典對(duì)所述訓(xùn)練文本集中的所有訓(xùn)練文本進(jìn)行標(biāo)注,獲得每個(gè)訓(xùn)練文本的標(biāo)注序列集;以及至少基于所述訓(xùn)練文本集的所有訓(xùn)練文本的標(biāo)注序列集進(jìn)行命名實(shí)體識(shí)別模型訓(xùn)練,獲得命名實(shí)體識(shí)別模型。本公開還提供一種命名實(shí)體識(shí)別方法、實(shí)體識(shí)別模型建立裝置、命名實(shí)體識(shí)別裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。