一種基于多任務(wù)學(xué)習(xí)的嵌套實(shí)體識(shí)別系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202011292686.8 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112347785A | 公開(kāi)(公告)日 | 2021-02-09 |
申請(qǐng)公布號(hào) | CN112347785A | 申請(qǐng)公布日 | 2021-02-09 |
分類號(hào) | G06F40/295(2020.01)I; | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 劉晨旭;范紅杰;胡振宇;柳軍飛 | 申請(qǐng)(專利權(quán))人 | 湖南國(guó)發(fā)控股有限公司 |
代理機(jī)構(gòu) | 長(zhǎng)沙市標(biāo)致專利代理事務(wù)所(普通合伙) | 代理人 | 蔣佳玉 |
地址 | 410011湖南省長(zhǎng)沙市雨花區(qū)美林街35號(hào)鹽船山生態(tài)園1棟2701房 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種基于多任務(wù)學(xué)習(xí)的嵌套實(shí)體識(shí)別系統(tǒng),本方法使用基于跨度的方法解決命名實(shí)體識(shí)別中命名實(shí)體出現(xiàn)嵌套的情況;利用BERT模型編碼上下文信息解決跨度表示的問(wèn)題;將命名實(shí)體識(shí)別分解為實(shí)體確定和實(shí)體分類兩個(gè)任務(wù),使用多任務(wù)學(xué)習(xí)的方法解決正負(fù)樣本分布不均衡的問(wèn)題;提出實(shí)體交并比損失函數(shù)解決困難樣本的問(wèn)題。本發(fā)明能有效解決嵌套命名實(shí)體問(wèn)題,與當(dāng)前未使用額外數(shù)據(jù)的同類方法對(duì)比,本發(fā)明在三個(gè)公開(kāi)嵌套命名實(shí)體數(shù)據(jù)集GENIA、ACE2004、ACE2005上均取得了最好效果,并且在非嵌套命名實(shí)體問(wèn)題上也能取得有競(jìng)爭(zhēng)力的效果,可以作為命名實(shí)體通用方法使用。?? |
