自動(dòng)提取列表數(shù)據(jù)的方法、系統(tǒng)、存儲(chǔ)介質(zhì)及電子設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202010802593.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112052368A 公開(kāi)(公告)日 2020-12-08
申請(qǐng)公布號(hào) CN112052368A 申請(qǐng)公布日 2020-12-08
分類號(hào) G06F16/951(2019.01)I;G06F16/958(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 楊鑫輝 申請(qǐng)(專利權(quán))人 北京新橙長(zhǎng)科技有限公司
代理機(jī)構(gòu) 北京市萬(wàn)慧達(dá)律師事務(wù)所 代理人 黃玉東
地址 100084北京市朝陽(yáng)區(qū)惠河南街禮安門A座
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)自動(dòng)提取列表數(shù)據(jù)的方法、系統(tǒng)、存儲(chǔ)介質(zhì)及電子設(shè)備,其中,該方法包括:獲取頁(yè)面中所有可點(diǎn)擊的元素的幾何信息及路徑,同時(shí)獲取頁(yè)面的幾何信息;依據(jù)路徑的層級(jí)對(duì)所有元素進(jìn)行分類聚合,得到至少一個(gè)列表;根據(jù)列表中元素的幾何信息篩選出所有豎向列表,同時(shí)得到每個(gè)豎向列表的幾何信息;基于豎向列表的幾何信息、豎向列表中每個(gè)元素的幾何信息以及頁(yè)面的幾何信息得到目標(biāo)數(shù)據(jù)列表,并提取目標(biāo)數(shù)據(jù)列表中元素的信息。該系統(tǒng)采用上述方法,實(shí)現(xiàn)了對(duì)網(wǎng)頁(yè)中目標(biāo)數(shù)據(jù)列表的數(shù)據(jù)進(jìn)行自動(dòng)準(zhǔn)確提取。??