一種基于多模態(tài)融合的文檔版面分類方法

基本信息

申請(qǐng)?zhí)?/td> CN202110854557.1 申請(qǐng)日 -
公開(公告)號(hào) CN113688872A 公開(公告)日 2021-11-23
申請(qǐng)公布號(hào) CN113688872A 申請(qǐng)公布日 2021-11-23
分類號(hào) G06K9/62;G06K9/00 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陶提;許諾;高翔;紀(jì)達(dá)麒;陳運(yùn)文 申請(qǐng)(專利權(quán))人 達(dá)觀數(shù)據(jù)(蘇州)有限公司
代理機(jī)構(gòu) 上海智力專利商標(biāo)事務(wù)所(普通合伙) 代理人 張文玄;周濤
地址 215133 江蘇省蘇州市相城區(qū)相城大道1168號(hào)品上商業(yè)中心5幢908室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于多模態(tài)融合的文檔版面分類方法,其特征在于,針對(duì)目標(biāo)文檔,包括:檢測(cè)目標(biāo)文檔,獲取待分類的檢測(cè)框;獲取檢測(cè)框的文本信息、框坐標(biāo)信息和圖像特征;采用多模態(tài)融合模型,以所述文本信息、框坐標(biāo)信息和圖像特征作為輸入,輸出檢測(cè)框的類型。本發(fā)明通過將文本、位置和圖像信息的多模態(tài)融合,提升了文檔版面分類的準(zhǔn)確率。