一種公文頭抽取方法、系統(tǒng)、裝置及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110344640.4 申請(qǐng)日 -
公開(公告)號(hào) CN113095061A 公開(公告)日 2021-07-09
申請(qǐng)公布號(hào) CN113095061A 申請(qǐng)公布日 2021-07-09
分類號(hào) G06F40/205(2020.01)I;G06F40/226(2020.01)I;G06F40/232(2020.01)I;G06F40/284(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 藍(lán)建敏;李觀春 申請(qǐng)(專利權(quán))人 京華信息科技股份有限公司
代理機(jī)構(gòu) 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 代理人 常柯陽
地址 510520廣東省廣州市天河區(qū)高普路138號(hào)京華信息大樓中座
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于隱馬爾可夫模型的公文頭抽取方法、系統(tǒng)、裝置及存儲(chǔ)介質(zhì);所述抽取方法包括獲取公文文本,所述公文文本包括公文標(biāo)題、公文體裁和公文內(nèi)容;利用訓(xùn)練好的隱馬爾可夫模型對(duì)所述公文文本進(jìn)行公文頭抽取;獲取所述訓(xùn)練好的隱馬爾可夫模型輸出的公文頭。本發(fā)明通過利用訓(xùn)練好的隱馬爾可夫模型對(duì)所述公文文本進(jìn)行公文頭抽取,能夠降低人工學(xué)習(xí)成本,提高公文頭抽取精準(zhǔn)度;同時(shí)能夠自動(dòng)對(duì)公文頭中存在的錯(cuò)誤進(jìn)行修訂。本發(fā)明可廣泛應(yīng)用于公文頭抽取技術(shù)領(lǐng)域。