一種頁面元素分類方法、解析器、介質(zhì)及設(shè)備
基本信息
申請?zhí)?/td> | CN202110378864.7 | 申請日 | - |
公開(公告)號 | CN113065600A | 公開(公告)日 | 2021-07-02 |
申請公布號 | CN113065600A | 申請公布日 | 2021-07-02 |
分類號 | G06K9/62;G06F8/20 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 游海濤;梁興通;王琳;楊豐佳 | 申請(專利權(quán))人 | 易聯(lián)眾信息技術(shù)股份有限公司 |
代理機(jī)構(gòu) | 廈門加減專利代理事務(wù)所(普通合伙) | 代理人 | 李強(qiáng);楊澤奇 |
地址 | 361008 福建省廈門市軟件園二期觀日路18號502室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及頁面元素分類技術(shù)領(lǐng)域,特別涉及一種頁面元素分類方法、解析器、介質(zhì)及設(shè)備,其中,一種頁面元素分類方法,包括提取已知頁面元素并分類,對已分類的所述已知頁面元素進(jìn)行元素特征提取;建立邏輯回歸模型,對所述邏輯回歸模型進(jìn)行分類訓(xùn)練;根據(jù)訓(xùn)練完成的所述邏輯回歸模型,對頁面文件上的頁面元素進(jìn)行分類;先通過已知頁面元素的分類及元素特征的提取,以便對邏輯回歸模型進(jìn)行分類訓(xùn)練,再利用訓(xùn)練完成的邏輯回歸模型對頁面文件上的頁面元素進(jìn)行分類,提升了頁面元素分類的準(zhǔn)確率,使分類更貼近于頁面元素的本質(zhì)特征,從而使得開發(fā)人員在升級改造中可以無需閱讀源碼即可得到更加合理的分類結(jié)果,降低了人工成本。 |
