一種基于國(guó)產(chǎn)CPU和操作系統(tǒng)的電子公文識(shí)別方法

基本信息

申請(qǐng)?zhí)?/td> CN202111291996.2 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN114140808A 公開(kāi)(公告)日 2022-03-04
申請(qǐng)公布號(hào) CN114140808A 申請(qǐng)公布日 2022-03-04
分類(lèi)號(hào) G06V30/414(2022.01)I;G06V30/416(2022.01)I;G06V30/42(2022.01)I;G06V30/148(2022.01)I;G06V30/19(2022.01)I;G06V10/94(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06K9/62(2022.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李利民;李楊 申請(qǐng)(專(zhuān)利權(quán))人 浪潮軟件集團(tuán)有限公司
代理機(jī)構(gòu) 濟(jì)南信達(dá)專(zhuān)利事務(wù)所有限公司 代理人 郗艷榮
地址 250100山東省濟(jì)南市高新區(qū)科航路2877號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明特別涉及一種基于國(guó)產(chǎn)CPU和操作系統(tǒng)的電子公文識(shí)別方法。該基于國(guó)產(chǎn)CPU和操作系統(tǒng)的電子公文識(shí)別方法,將圖片灰度化得到灰度圖;對(duì)灰度圖進(jìn)行歸一化處理得到初步分割的公文區(qū)域數(shù)據(jù);建立CTPN神經(jīng)網(wǎng)絡(luò)模型,對(duì)公文區(qū)域進(jìn)行預(yù)測(cè)得到切割好的公文區(qū)域數(shù)據(jù)集,輸入CRNN+CTC神經(jīng)網(wǎng)絡(luò)得到初始公文信息,經(jīng)卷積和池化,提取特征得到特征圖,預(yù)測(cè)特征圖標(biāo)簽分布和最終的標(biāo)簽序列,得到最終預(yù)測(cè)的公文信息。該基于國(guó)產(chǎn)CPU和操作系統(tǒng)的電子公文識(shí)別方法,能夠在全國(guó)產(chǎn)軟硬件環(huán)境下,自動(dòng)識(shí)別讀取紙質(zhì)公文的正文內(nèi)容,并轉(zhuǎn)錄為電子公文,提高了國(guó)產(chǎn)環(huán)境下電子公文系統(tǒng)的辦公效率,進(jìn)一步保障了信息安全,同時(shí)還能兼容不同國(guó)產(chǎn)操作系統(tǒng)和瀏覽器,適宜推廣應(yīng)用。