一種基于掃描的英語作文試卷版面分析方法

基本信息

申請?zhí)?/td> CN202011514723.5 申請日 -
公開(公告)號 CN112598004A 公開(公告)日 2021-04-02
申請公布號 CN112598004A 申請公布日 2021-04-02
分類號 G06K9/34(2006.01)I;G06K9/62(2006.01)I;G06N3/08(2006.01)I;G06N3/04(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 李哲;侯沖;陳家海;葉家鳴;吳波 申請(專利權)人 安徽七天網(wǎng)絡科技有限公司
代理機構(gòu) 安徽申策知識產(chǎn)權代理事務所(普通合伙) 代理人 程艷梅
地址 230000安徽省合肥市新站區(qū)銅陵北路與潁河路交口新站總部經(jīng)濟大廈B樓1201室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于掃描的英語作文試卷版面分析方法,涉及文本檢測領域。針對掃描的英語作文試卷這種特殊的文檔圖像數(shù)據(jù),提出了基于語義分割方法解決手寫文本檢測的方案。整體基于語義分割網(wǎng)絡架構(gòu),利用Resnet?Block(殘差結(jié)構(gòu))提取手寫文本特征,實現(xiàn)英語作文試卷前景和背景的分離,并設計了多比例特征圖融合機制和特殊的圖像標簽預處理機制,提高了手寫文本檢測召回率,提高了不規(guī)則形狀文本檢測效果,解決了近鄰文本行的易粘連難分割問題,簡化了語義分割的后處理過程,提高了OCR(光學字符識別)效率。本發(fā)明主要包含以下步驟:數(shù)據(jù)預處理、網(wǎng)絡結(jié)構(gòu)設計、目標函數(shù)設計、網(wǎng)絡輸出后處理。??