文本信息處理方法、系統(tǒng)、設(shè)備及計算機(jī)可讀存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202010248972.8 申請日 -
公開(公告)號 CN111460827A 公開(公告)日 2020-07-28
申請公布號 CN111460827A 申請公布日 2020-07-28
分類號 G06F40/295(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 鄔國銳;李楊 申請(專利權(quán))人 北京愛咔咔信息技術(shù)有限公司
代理機(jī)構(gòu) 北京致科知識產(chǎn)權(quán)代理有限公司 代理人 北京愛咔咔信息技術(shù)有限公司
地址 100085北京市海淀區(qū)上地四街8號樓502-6
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種文本信息處理方法、系統(tǒng)、設(shè)備及計算機(jī)可讀存儲介質(zhì)。本發(fā)明的方法,通過預(yù)先采用與所述待處理文本的類型對應(yīng)的糾錯訓(xùn)練集訓(xùn)練得到的糾錯模型,對待處理文本進(jìn)行糾錯處理,得到所述待處理文本的至少一個糾正文本,實現(xiàn)對待處理文本中的字形錯誤等進(jìn)行糾正;通過預(yù)先采用與所述待處理文本的類型對應(yīng)的結(jié)構(gòu)化特征訓(xùn)練集訓(xùn)練得到的命名實體識別模型,提取所述糾正文本的結(jié)構(gòu)化特征,并將所述糾正文本的結(jié)構(gòu)化特征與可信數(shù)據(jù)集中各個標(biāo)準(zhǔn)文本信息的結(jié)構(gòu)化特征進(jìn)行匹配,確定與所述糾正文本對應(yīng)的標(biāo)準(zhǔn)文本信息,實現(xiàn)進(jìn)一步地通過結(jié)構(gòu)化特征對糾正文本中存在的命名實體錯誤進(jìn)行糾正,提高了文本信息識別的準(zhǔn)確率。??