一種閱讀理解形式的命名實(shí)體識(shí)別神經(jīng)結(jié)構(gòu)

基本信息

申請(qǐng)?zhí)?/td> CN202210244978.7 申請(qǐng)日 -
公開(公告)號(hào) CN114648113A 公開(公告)日 2022-06-21
申請(qǐng)公布號(hào) CN114648113A 申請(qǐng)公布日 2022-06-21
分類號(hào) G06N3/08(2006.01)I;G06F40/295(2020.01)I;G06N3/04(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 沈翀;劉洪強(qiáng);胡靜遠(yuǎn) 申請(qǐng)(專利權(quán))人 南通海賽未來數(shù)字科技有限公司
代理機(jī)構(gòu) 南通云創(chuàng)慧泉專利代理事務(wù)所(普通合伙) 代理人 -
地址 215000江蘇省蘇州市高新區(qū)昆侖山路58號(hào)1幢
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于命名實(shí)體識(shí)別技術(shù)領(lǐng)域,具體公開了一種閱讀理解形式的命名實(shí)體識(shí)別神經(jīng)結(jié)構(gòu),包括:預(yù)處理模塊,用于對(duì)文本中的句子進(jìn)行預(yù)處理,所述的預(yù)處理包括分詞、詞性標(biāo)注、命名實(shí)體識(shí)別,將單詞映射成詞表當(dāng)中對(duì)應(yīng)的詞向量,并與詞性及命名實(shí)體類型的特征向量拼接在一起,形成文本的初始特征向量表示;神經(jīng)網(wǎng)絡(luò)訓(xùn)練模塊,用于將各個(gè)句子的所述初始特征向量作為訓(xùn)練樣本,導(dǎo)入多層神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,得到中文命名實(shí)體識(shí)別模型;實(shí)體標(biāo)注模塊,用于應(yīng)用所述中文命名實(shí)體識(shí)別模型對(duì)目標(biāo)文本進(jìn)行中文命名實(shí)體識(shí)別,獲取實(shí)體標(biāo)注結(jié)果。該方案的命名實(shí)體識(shí)別神經(jīng)結(jié)構(gòu)容易實(shí)現(xiàn),并且開發(fā)和運(yùn)行成本較低。有利于生成更加準(zhǔn)確而流暢的答案文本。