一種基于平格增強(qiáng)線性轉(zhuǎn)換器的命名實(shí)體識(shí)別方法和系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202110408126.2 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112989834B | 公開(kāi)(公告)日 | 2021-08-20 |
申請(qǐng)公布號(hào) | CN112989834B | 申請(qǐng)公布日 | 2021-08-20 |
分類號(hào) | G06F40/295(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 陳哲乾;李一夫;馬一凡 | 申請(qǐng)(專利權(quán))人 | 杭州一知智能科技有限公司 |
代理機(jī)構(gòu) | 杭州求是專利事務(wù)所有限公司 | 代理人 | 鄭海峰 |
地址 | 311200浙江省杭州市蕭山區(qū)啟迪路198號(hào)杭州灣信息港F座7樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于平格增強(qiáng)線性轉(zhuǎn)換器的命名實(shí)體識(shí)別方法和系統(tǒng),屬于自然語(yǔ)言處理命名實(shí)體識(shí)別領(lǐng)域。首先獲取文本序列樣本并標(biāo)注實(shí)體的標(biāo)簽類別,將文本序列轉(zhuǎn)換為平格結(jié)構(gòu);之后識(shí)別模型,通過(guò)最小化負(fù)對(duì)數(shù)似然損失函數(shù)對(duì)命名實(shí)體識(shí)別模型進(jìn)行訓(xùn)練;在命名實(shí)體識(shí)別過(guò)程中,針對(duì)待識(shí)別的文本序列,經(jīng)文本預(yù)處理后作為訓(xùn)練好的命名實(shí)體識(shí)別模型的輸入,根據(jù)最大化預(yù)測(cè)得分獲得識(shí)別結(jié)果。本發(fā)明基于更加高效的平格結(jié)構(gòu)引入詞匯信息進(jìn)行詞匯增強(qiáng),為模型提供先驗(yàn)知識(shí)和實(shí)體的詞匯邊界信息,提高了模型對(duì)實(shí)體邊界和實(shí)體類型的識(shí)別準(zhǔn)確率。使用線性轉(zhuǎn)換器對(duì)上下文信息進(jìn)行建模,降低了模型復(fù)雜度,顯著提高了模型運(yùn)算效率,具有更高的實(shí)用價(jià)值。 |
