一種基于深度學(xué)習(xí)的頁(yè)面結(jié)構(gòu)識(shí)別抽取方法
基本信息
申請(qǐng)?zhí)?/td> | CN202010456536.X | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN111625702A | 公開(kāi)(公告)日 | 2020-09-04 |
申請(qǐng)公布號(hào) | CN111625702A | 申請(qǐng)公布日 | 2020-09-04 |
分類(lèi)號(hào) | G06F16/951(2019.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 董昊辰;方仁貴;高曉輝;郭路路;何曉剛;何召陽(yáng);李克萌;劉兵;王欣宇;郗朝旭;謝鑫;趙岱翀;周歡;朱偉光 | 申請(qǐng)(專(zhuān)利權(quán))人 | 北京墨云科技有限公司 |
代理機(jī)構(gòu) | 北京專(zhuān)贏專(zhuān)利代理有限公司 | 代理人 | 劉梅 |
地址 | 100089北京市海淀區(qū)上地信息路12號(hào)3層A區(qū)A315 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于深度學(xué)習(xí)的頁(yè)面結(jié)構(gòu)識(shí)別抽取方法,包含以下步驟:A、頁(yè)面數(shù)據(jù)獲??;B、進(jìn)行特征工程;C、自然語(yǔ)言處理;D、對(duì)文本節(jié)點(diǎn)內(nèi)容進(jìn)行學(xué)習(xí)訓(xùn)練;E、對(duì)節(jié)點(diǎn)序列進(jìn)行學(xué)習(xí)訓(xùn)練;F、進(jìn)入Softmax層進(jìn)行分類(lèi),本發(fā)明的有益效果是:1、提高了頁(yè)面結(jié)構(gòu)識(shí)別的準(zhǔn)確度;2、無(wú)需編寫(xiě)規(guī)則,減輕相關(guān)人員工作壓力;3、對(duì)于不規(guī)整的頁(yè)面也可以進(jìn)行識(shí)別;4、方便靈活,實(shí)時(shí)快捷;5、使用城本低。?? |
