一種頁面元素分類方法、解析器、介質(zhì)及設(shè)備

基本信息

申請?zhí)?/td> CN202110378864.7 申請日 -
公開(公告)號 CN113065600A 公開(公告)日 2021-07-02
申請公布號 CN113065600A 申請公布日 2021-07-02
分類號 G06K9/62;G06F8/20 分類 計算;推算;計數(shù);
發(fā)明人 游海濤;梁興通;王琳;楊豐佳 申請(專利權(quán))人 易聯(lián)眾信息技術(shù)股份有限公司
代理機(jī)構(gòu) 廈門加減專利代理事務(wù)所(普通合伙) 代理人 李強(qiáng);楊澤奇
地址 361008 福建省廈門市軟件園二期觀日路18號502室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及頁面元素分類技術(shù)領(lǐng)域,特別涉及一種頁面元素分類方法、解析器、介質(zhì)及設(shè)備,其中,一種頁面元素分類方法,包括提取已知頁面元素并分類,對已分類的所述已知頁面元素進(jìn)行元素特征提取;建立邏輯回歸模型,對所述邏輯回歸模型進(jìn)行分類訓(xùn)練;根據(jù)訓(xùn)練完成的所述邏輯回歸模型,對頁面文件上的頁面元素進(jìn)行分類;先通過已知頁面元素的分類及元素特征的提取,以便對邏輯回歸模型進(jìn)行分類訓(xùn)練,再利用訓(xùn)練完成的邏輯回歸模型對頁面文件上的頁面元素進(jìn)行分類,提升了頁面元素分類的準(zhǔn)確率,使分類更貼近于頁面元素的本質(zhì)特征,從而使得開發(fā)人員在升級改造中可以無需閱讀源碼即可得到更加合理的分類結(jié)果,降低了人工成本。