一種基于國產(chǎn)CPU和操作系統(tǒng)的電子公文識別方法

基本信息

申請?zhí)?/td> CN202111291996.2 申請日 -
公開(公告)號 CN114140808A 公開(公告)日 2022-03-04
申請公布號 CN114140808A 申請公布日 2022-03-04
分類號 G06V30/414(2022.01)I;G06V30/416(2022.01)I;G06V30/42(2022.01)I;G06V30/148(2022.01)I;G06V30/19(2022.01)I;G06V10/94(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06K9/62(2022.01)I 分類 計算;推算;計數(shù);
發(fā)明人 李利民;李楊 申請(專利權(quán))人 浪潮軟件集團(tuán)有限公司
代理機(jī)構(gòu) 濟(jì)南信達(dá)專利事務(wù)所有限公司 代理人 郗艷榮
地址 250100山東省濟(jì)南市高新區(qū)科航路2877號
法律狀態(tài) -

摘要

摘要 本發(fā)明特別涉及一種基于國產(chǎn)CPU和操作系統(tǒng)的電子公文識別方法。該基于國產(chǎn)CPU和操作系統(tǒng)的電子公文識別方法,將圖片灰度化得到灰度圖;對灰度圖進(jìn)行歸一化處理得到初步分割的公文區(qū)域數(shù)據(jù);建立CTPN神經(jīng)網(wǎng)絡(luò)模型,對公文區(qū)域進(jìn)行預(yù)測得到切割好的公文區(qū)域數(shù)據(jù)集,輸入CRNN+CTC神經(jīng)網(wǎng)絡(luò)得到初始公文信息,經(jīng)卷積和池化,提取特征得到特征圖,預(yù)測特征圖標(biāo)簽分布和最終的標(biāo)簽序列,得到最終預(yù)測的公文信息。該基于國產(chǎn)CPU和操作系統(tǒng)的電子公文識別方法,能夠在全國產(chǎn)軟硬件環(huán)境下,自動識別讀取紙質(zhì)公文的正文內(nèi)容,并轉(zhuǎn)錄為電子公文,提高了國產(chǎn)環(huán)境下電子公文系統(tǒng)的辦公效率,進(jìn)一步保障了信息安全,同時還能兼容不同國產(chǎn)操作系統(tǒng)和瀏覽器,適宜推廣應(yīng)用。