一種基于深度學(xué)習(xí)的檔案影像信息結(jié)構(gòu)化構(gòu)建方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202011398958.2 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112541490A | 公開(kāi)(公告)日 | 2021-03-23 |
申請(qǐng)公布號(hào) | CN112541490A | 申請(qǐng)公布日 | 2021-03-23 |
分類(lèi)號(hào) | G06N3/08(2006.01)I;G06K9/20(2006.01)I;G06K9/34(2006.01)I;G06N3/04(2006.01)I;G06T5/00(2006.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 曹孟君;曾智;胡磊;陳韻;盧強(qiáng);孫穎;鄒瑤;劉小保;黎浩云;才翔;宋莎 | 申請(qǐng)(專利權(quán))人 | 廣州城市規(guī)劃技術(shù)開(kāi)發(fā)服務(wù)部有限公司 |
代理機(jī)構(gòu) | 廣州三環(huán)專利商標(biāo)代理有限公司 | 代理人 | 顏希文;郝傳鑫 |
地址 | 510000廣東省廣州市越秀區(qū)洪橋街東風(fēng)中路300號(hào)之一19樓西 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于深度學(xué)習(xí)的檔案影像信息結(jié)構(gòu)化構(gòu)建方法及裝置,該方法包括如下步驟:步驟S1,獲取檔案圖片,對(duì)所述檔案圖片進(jìn)行預(yù)處理,獲得檔案圖片樣本;步驟S2,對(duì)檔案圖片樣本進(jìn)行人工文本定位標(biāo)注,提取關(guān)鍵詞,進(jìn)行文本識(shí)別,并通過(guò)多次學(xué)習(xí)的方式構(gòu)建端到端的深度學(xué)習(xí)模型,并使用訓(xùn)練樣本進(jìn)行訓(xùn)練,得到最終的檔案影像信息構(gòu)建模型;步驟S3,輸入待識(shí)別檔案圖片,經(jīng)訓(xùn)練好的檔案影像信息構(gòu)建模型進(jìn)行文字的定位、識(shí)別和關(guān)鍵詞提取,將輸出內(nèi)容保存為預(yù)設(shè)格式,并提取至標(biāo)注庫(kù)文件;步驟S4,通過(guò)標(biāo)注庫(kù)工具進(jìn)行提取、入庫(kù)存儲(chǔ)進(jìn)行結(jié)構(gòu)化構(gòu)建。?? |
