基于目標(biāo)檢測(cè)的研報(bào)解析方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110380917.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112990091A 公開(kāi)(公告)日 2021-06-18
申請(qǐng)公布號(hào) CN112990091A 申請(qǐng)公布日 2021-06-18
分類號(hào) G06K9/00;G06K9/46;G06N3/04;G06N3/08 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 朱召文;李宜博;李鵬 申請(qǐng)(專利權(quán))人 數(shù)庫(kù)(上海)科技有限公司
代理機(jī)構(gòu) 上海十蕙一蘭知識(shí)產(chǎn)權(quán)代理有限公司 代理人 劉秋蘭
地址 201112 上海市閔行區(qū)陳行路2388號(hào)9號(hào)樓8層801室
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于數(shù)據(jù)處理技術(shù)領(lǐng)域,具體涉及一種基于目標(biāo)檢測(cè)的研報(bào)解析方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)。其中方法包括獲取研報(bào)文件,通過(guò)目標(biāo)檢測(cè)模型對(duì)研報(bào)文件進(jìn)行目標(biāo)檢測(cè),得到目標(biāo)檢測(cè)結(jié)果;解析研報(bào)文件,獲取研報(bào)文件內(nèi)每一頁(yè)中的字符信息,根據(jù)目標(biāo)檢測(cè)結(jié)果,將位于同一個(gè)目標(biāo)內(nèi)的字符進(jìn)行合并,得到結(jié)構(gòu)化信息;匯總研報(bào)文件內(nèi)每一頁(yè)的結(jié)構(gòu)化信息,生成研報(bào)文件的結(jié)構(gòu)化數(shù)據(jù)。本發(fā)明通過(guò)訓(xùn)練以研報(bào)版面分析為基礎(chǔ)的目標(biāo)檢測(cè)模型,極大的簡(jiǎn)化了研報(bào)文件解析的流程,在不需要復(fù)雜規(guī)則的條件下,就可以充分的結(jié)構(gòu)化研報(bào)內(nèi)容。