一種用于古籍文檔圖像二值化的卷積網(wǎng)絡
基本信息
申請?zhí)?/td> | CN202111168224.X | 申請日 | - |
公開(公告)號 | CN113901913A | 公開(公告)日 | 2022-01-07 |
申請公布號 | CN113901913A | 申請公布日 | 2022-01-07 |
分類號 | G06K9/00(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 李澤輝;吳海波;王華龍;楊海東 | 申請(專利權)人 | 佛山市廣工大數(shù)控裝備技術發(fā)展有限公司 |
代理機構 | 廣州科沃園專利代理有限公司 | 代理人 | 王維霞 |
地址 | 528200廣東省佛山市南海高新區(qū)佛高科技智庫中心A座4樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種用于古籍文檔圖像二值化的卷積網(wǎng)絡,包括LinkNet架構、D?LinkNet架構和空間金字塔池化(SPP)模塊(part C);所述LinkNet架構包括編碼器(part A)和解碼器(part D);所述DP?LinkNet架構包括編碼器(partA)、混聯(lián)空洞卷積(HDC)模塊(part B)和解碼器(part D);所述古籍文檔圖像二值化的卷積網(wǎng)絡以預訓練好的編碼器(part A)作為其骨干網(wǎng)絡;所述編碼器(part A)為在ImageNet數(shù)據(jù)集上預訓練的ResNet?34;所述編碼器(part A)的模型第一層為7×7的卷積層,具有64個輸出通道,跨度為2;所述編碼器(partA)的第二層為批量歸一化(BN)層;該古籍文檔圖像二值化的卷積網(wǎng)絡,提高了計算機對于歷史古籍識別的準確度,能夠有效對多語種和不同的字符進行混排,并識別出不同大小、顏色、亮度、字體的字符。 |
