亚洲色图青草,最近中文字幕在线一区

請(qǐng)輸入想查詢(xún)的關(guān)鍵字

查詢(xún)

退出

會(huì)員

商務(wù)合作

瀏覽歷史

清除

首頁(yè)/ 北京眾信博雅科技有限公司/ 專(zhuān)利詳情

一種連續(xù)頁(yè)版式文檔結(jié)構(gòu)化信息提取方法

基本信息

申請(qǐng)?zhí)?/td>	CN201910742447.9	申請(qǐng)日	-
公開(kāi)（公告）號(hào)	CN110704570A	公開(kāi)（公告）日	2020-01-17
申請(qǐng)公布號(hào)	CN110704570A	申請(qǐng)公布日	2020-01-17
分類(lèi)號(hào)	G06F16/31;G06F40/279;G06F40/258;G06F40/205	分類(lèi)	計(jì)算；推算；計(jì)數(shù);
發(fā)明人	徐劍波;張?jiān)娪?王磊;趙東巖	申請(qǐng)（專(zhuān)利權(quán)）人	北京眾信博雅科技有限公司
代理機(jī)構(gòu)	-	代理人	-
地址	100000 北京市海淀區(qū)西三旗安寧莊路4號(hào)9號(hào)樓4層0996
法律狀態(tài)	-

摘要

本發(fā)明涉及本發(fā)明涉及一種連續(xù)頁(yè)版式文檔的結(jié)構(gòu)化方法，本發(fā)明所述的方法，通過(guò)逐頁(yè)提取連續(xù)頁(yè)版式文檔中的文字、字體、字號(hào)、位置等信息，通過(guò)預(yù)處理識(shí)別并去除頁(yè)眉頁(yè)腳，識(shí)別并切分腳注，再把剩下的多頁(yè)正文內(nèi)容及腳注內(nèi)容分別合并成一個(gè)虛擬頁(yè)，再對(duì)虛擬頁(yè)進(jìn)行版面分析，合并文本塊，進(jìn)行分欄及表格處理，生成文本塊表，再利用文本塊表的編號(hào)、字體字號(hào)、對(duì)齊等特性按規(guī)則進(jìn)行大綱提取，從而還原整個(gè)文件的邏輯結(jié)構(gòu)。采用本發(fā)明所述的方法，可以有效去除頁(yè)眉頁(yè)腳、腳注等干擾文本，保證分欄的閱讀順序，極大提高文本的結(jié)構(gòu)化正確性，降低人工糾正的工作量，提高效率。

www久久伊人网|无码 av 一区|精品国产污污网站|欧美日韩无码一区|九九精品视在线看|久久人人爽人人骑|亚洲色图激情人妻|玖玖九九无码视频|AV天堂亚洲欧洲|日韩 内射 人妻

www久久伊人网|无码 av 一区|精品国产污污网站|欧美日韩无码一区|九九精品视在线看|久久人人爽人人骑|亚洲色图激情人妻|玖玖九九无码视频|AV天堂亚洲欧洲|日韩内射人妻