自動(dòng)提取列表數(shù)據(jù)的方法、系統(tǒng)、存儲(chǔ)介質(zhì)及電子設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN202010802593.9 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112052368A | 公開(kāi)(公告)日 | 2020-12-08 |
申請(qǐng)公布號(hào) | CN112052368A | 申請(qǐng)公布日 | 2020-12-08 |
分類(lèi)號(hào) | G06F16/951(2019.01)I;G06F16/958(2019.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 楊鑫輝 | 申請(qǐng)(專(zhuān)利權(quán))人 | 北京新橙科技有限公司 |
代理機(jī)構(gòu) | 北京市萬(wàn)慧達(dá)律師事務(wù)所 | 代理人 | 黃玉東 |
地址 | 100084北京市朝陽(yáng)區(qū)惠河南街禮安門(mén)A座 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)自動(dòng)提取列表數(shù)據(jù)的方法、系統(tǒng)、存儲(chǔ)介質(zhì)及電子設(shè)備,其中,該方法包括:獲取頁(yè)面中所有可點(diǎn)擊的元素的幾何信息及路徑,同時(shí)獲取頁(yè)面的幾何信息;依據(jù)路徑的層級(jí)對(duì)所有元素進(jìn)行分類(lèi)聚合,得到至少一個(gè)列表;根據(jù)列表中元素的幾何信息篩選出所有豎向列表,同時(shí)得到每個(gè)豎向列表的幾何信息;基于豎向列表的幾何信息、豎向列表中每個(gè)元素的幾何信息以及頁(yè)面的幾何信息得到目標(biāo)數(shù)據(jù)列表,并提取目標(biāo)數(shù)據(jù)列表中元素的信息。該系統(tǒng)采用上述方法,實(shí)現(xiàn)了對(duì)網(wǎng)頁(yè)中目標(biāo)數(shù)據(jù)列表的數(shù)據(jù)進(jìn)行自動(dòng)準(zhǔn)確提取。?? |
