基于機(jī)器學(xué)習(xí)識(shí)別圖紙內(nèi)圖例及文字的方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202010028706.4 申請(qǐng)日 -
公開(公告)號(hào) CN111242024A 公開(公告)日 2020-06-05
申請(qǐng)公布號(hào) CN111242024A 申請(qǐng)公布日 2020-06-05
分類號(hào) G06K9/00(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 林希;宋楠;謝宏 申請(qǐng)(專利權(quán))人 北京互時(shí)科技股份有限公司
代理機(jī)構(gòu) 北京紐樂康知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 張朝元
地址 100193北京市海淀區(qū)東北旺西路8號(hào)中關(guān)村軟件園8號(hào)樓二層234
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于機(jī)器學(xué)習(xí)識(shí)別圖紙內(nèi)圖例及文字的方法及系統(tǒng),該方法包括以下步驟:S1 運(yùn)用數(shù)據(jù)集構(gòu)建包含圖例特征的圖例訓(xùn)練集與包含文字特征的文字訓(xùn)練集;S2 運(yùn)用數(shù)據(jù)集和卷積神經(jīng)網(wǎng)絡(luò)獲取識(shí)別圖例及識(shí)別文字的神經(jīng)網(wǎng)絡(luò)模型;S3 采用S2中建立的神經(jīng)網(wǎng)絡(luò)模型獲取圖紙中的圖例及文字。本發(fā)明的有益效果:通過已有圖紙生成圖例訓(xùn)練集及文字訓(xùn)練集,運(yùn)用圖例訓(xùn)練集與文字訓(xùn)練集對(duì)待識(shí)別圖例與待識(shí)別文字進(jìn)型預(yù)訓(xùn)練,獲得識(shí)別文字區(qū)域與識(shí)別圖例區(qū)域的神經(jīng)網(wǎng)絡(luò)模型,同時(shí)運(yùn)用規(guī)則分類文字及建立文字與圖例之間的關(guān)系,基于深度學(xué)習(xí)技術(shù)完成圖例與文字的訓(xùn)練數(shù)據(jù)以及自動(dòng)生成學(xué)習(xí)特征和模型參數(shù),以滿足不同場(chǎng)景的文本及圖例的識(shí)別與提取。??