一種基于多模態(tài)融合的文檔版面分類方法
基本信息
申請(qǐng)?zhí)?/td> | CN202110854557.1 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113688872A | 公開(公告)日 | 2021-11-23 |
申請(qǐng)公布號(hào) | CN113688872A | 申請(qǐng)公布日 | 2021-11-23 |
分類號(hào) | G06K9/62;G06K9/00 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 陶提;許諾;高翔;紀(jì)達(dá)麒;陳運(yùn)文 | 申請(qǐng)(專利權(quán))人 | 達(dá)觀數(shù)據(jù)(蘇州)有限公司 |
代理機(jī)構(gòu) | 上海智力專利商標(biāo)事務(wù)所(普通合伙) | 代理人 | 張文玄;周濤 |
地址 | 215133 江蘇省蘇州市相城區(qū)相城大道1168號(hào)品上商業(yè)中心5幢908室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于多模態(tài)融合的文檔版面分類方法,其特征在于,針對(duì)目標(biāo)文檔,包括:檢測(cè)目標(biāo)文檔,獲取待分類的檢測(cè)框;獲取檢測(cè)框的文本信息、框坐標(biāo)信息和圖像特征;采用多模態(tài)融合模型,以所述文本信息、框坐標(biāo)信息和圖像特征作為輸入,輸出檢測(cè)框的類型。本發(fā)明通過將文本、位置和圖像信息的多模態(tài)融合,提升了文檔版面分類的準(zhǔn)確率。 |
