一種用于命名實體識別的方法與裝置

基本信息

申請?zhí)?/td> CN201911088877.X 申請日 -
公開(公告)號 CN110889287A 公開(公告)日 2020-03-17
申請公布號 CN110889287A 申請公布日 2020-03-17
分類號 G06F40/295 分類 計算;推算;計數(shù);
發(fā)明人 宋思睿;宋彥 申請(專利權(quán))人 創(chuàng)新工場(廣州)人工智能研究有限公司
代理機構(gòu) 北京啟坤知識產(chǎn)權(quán)代理有限公司 代理人 趙晶
地址 510700 廣東省廣州市黃埔區(qū)光譜中路23號A2棟1001房
法律狀態(tài) -

摘要

摘要 本發(fā)明的目的是提供一種命名實體識別方法與裝置。通過經(jīng)訓練好的命名實體識別模型對檢測文本進行命名實體識別,根據(jù)首次輸出的識別結(jié)果維護對應所述檢測文本的詞表,所述詞表包括已識別的命名實體及其屬性信息;將由所述詞表生成的輸入詞向量與所述檢測文本再次輸入所述命名實體識別模型,以獲得新一輪的識別結(jié)果并更新所述詞表,經(jīng)過多輪循環(huán)直至當前識別的命名實體與上一輪識別的命名實體一致;根據(jù)最后一輪的識別結(jié)果,確定所述檢測文本中的命名實體。由于引入了動態(tài)詞表,本發(fā)明可以在NER檢測過程中不斷地擴充檢測文本的詞表,從而提高了詞表的覆蓋范圍,使得預測難度低的詞能夠先被加入詞表中來幫助識別預測難度大的詞,增加了NER的識別準確率。