一種基于多任務(wù)學(xué)習(xí)的嵌套實(shí)體識(shí)別系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202011292686.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112347785A 公開(kāi)(公告)日 2021-02-09
申請(qǐng)公布號(hào) CN112347785A 申請(qǐng)公布日 2021-02-09
分類號(hào) G06F40/295(2020.01)I; 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 劉晨旭;范紅杰;胡振宇;柳軍飛 申請(qǐng)(專利權(quán))人 湖南國(guó)發(fā)控股有限公司
代理機(jī)構(gòu) 長(zhǎng)沙市標(biāo)致專利代理事務(wù)所(普通合伙) 代理人 蔣佳玉
地址 410011湖南省長(zhǎng)沙市雨花區(qū)美林街35號(hào)鹽船山生態(tài)園1棟2701房
法律狀態(tài) -

摘要

摘要 一種基于多任務(wù)學(xué)習(xí)的嵌套實(shí)體識(shí)別系統(tǒng),本方法使用基于跨度的方法解決命名實(shí)體識(shí)別中命名實(shí)體出現(xiàn)嵌套的情況;利用BERT模型編碼上下文信息解決跨度表示的問(wèn)題;將命名實(shí)體識(shí)別分解為實(shí)體確定和實(shí)體分類兩個(gè)任務(wù),使用多任務(wù)學(xué)習(xí)的方法解決正負(fù)樣本分布不均衡的問(wèn)題;提出實(shí)體交并比損失函數(shù)解決困難樣本的問(wèn)題。本發(fā)明能有效解決嵌套命名實(shí)體問(wèn)題,與當(dāng)前未使用額外數(shù)據(jù)的同類方法對(duì)比,本發(fā)明在三個(gè)公開(kāi)嵌套命名實(shí)體數(shù)據(jù)集GENIA、ACE2004、ACE2005上均取得了最好效果,并且在非嵌套命名實(shí)體問(wèn)題上也能取得有競(jìng)爭(zhēng)力的效果,可以作為命名實(shí)體通用方法使用。??