一種基于多任務(wù)模型進(jìn)行文本處理的方法、裝置、計(jì)算機(jī)裝置及計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202110403610.6 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113095082A | 公開(公告)日 | 2021-07-09 |
申請(qǐng)公布號(hào) | CN113095082A | 申請(qǐng)公布日 | 2021-07-09 |
分類號(hào) | G06F40/295(2020.01)I;G06F40/284(2020.01)I;G06F40/242(2020.01)I;G06F16/31(2019.01)I;G06F40/30(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 譚洋;段煉;周忠誠(chéng);張圣棟;黃九鳴;杜海燕 | 申請(qǐng)(專利權(quán))人 | 湖南四方天箭信息科技有限公司 |
代理機(jī)構(gòu) | 長(zhǎng)沙智嶸專利代理事務(wù)所(普通合伙) | 代理人 | 顏漢華 |
地址 | 410000湖南省長(zhǎng)沙市高新開發(fā)區(qū)岳麓西大道588號(hào)芯城科技園8棟1301房 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于多任務(wù)模型進(jìn)行文本處理的方法、裝置、計(jì)算機(jī)裝置及計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì),該方法利用一個(gè)多任務(wù)模型即可同時(shí)進(jìn)行分詞處理、詞性標(biāo)注和命名實(shí)體識(shí)別這三個(gè)任務(wù),模型加載快、預(yù)測(cè)時(shí)間短,不存在不同預(yù)測(cè)模型之間的誤差傳播,整體精度較高,并且在模型推理過程中通過將分詞標(biāo)簽、詞性標(biāo)簽和命名實(shí)體識(shí)別標(biāo)簽融合成一個(gè)標(biāo)簽文本,即三個(gè)任務(wù)使用同一套標(biāo)簽系統(tǒng),避免了標(biāo)簽系統(tǒng)多而導(dǎo)致可能產(chǎn)生混淆的問題,在模型輸出標(biāo)簽文本之后再將融合標(biāo)簽拆分成三個(gè)任務(wù)對(duì)應(yīng)的標(biāo)簽,然后經(jīng)過格式化處理后輸出,結(jié)果更加規(guī)范、直觀。 |
