一種頁(yè)面元素分類(lèi)方法、解析器、介質(zhì)及設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202110378864.7 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113065600A 公開(kāi)(公告)日 2021-07-02
申請(qǐng)公布號(hào) CN113065600A 申請(qǐng)公布日 2021-07-02
分類(lèi)號(hào) G06K9/62;G06F8/20 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 游海濤;梁興通;王琳;楊豐佳 申請(qǐng)(專(zhuān)利權(quán))人 易聯(lián)眾信息技術(shù)股份有限公司
代理機(jī)構(gòu) 廈門(mén)加減專(zhuān)利代理事務(wù)所(普通合伙) 代理人 李強(qiáng);楊澤奇
地址 361008 福建省廈門(mén)市軟件園二期觀日路18號(hào)502室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及頁(yè)面元素分類(lèi)技術(shù)領(lǐng)域,特別涉及一種頁(yè)面元素分類(lèi)方法、解析器、介質(zhì)及設(shè)備,其中,一種頁(yè)面元素分類(lèi)方法,包括提取已知頁(yè)面元素并分類(lèi),對(duì)已分類(lèi)的所述已知頁(yè)面元素進(jìn)行元素特征提??;建立邏輯回歸模型,對(duì)所述邏輯回歸模型進(jìn)行分類(lèi)訓(xùn)練;根據(jù)訓(xùn)練完成的所述邏輯回歸模型,對(duì)頁(yè)面文件上的頁(yè)面元素進(jìn)行分類(lèi);先通過(guò)已知頁(yè)面元素的分類(lèi)及元素特征的提取,以便對(duì)邏輯回歸模型進(jìn)行分類(lèi)訓(xùn)練,再利用訓(xùn)練完成的邏輯回歸模型對(duì)頁(yè)面文件上的頁(yè)面元素進(jìn)行分類(lèi),提升了頁(yè)面元素分類(lèi)的準(zhǔn)確率,使分類(lèi)更貼近于頁(yè)面元素的本質(zhì)特征,從而使得開(kāi)發(fā)人員在升級(jí)改造中可以無(wú)需閱讀源碼即可得到更加合理的分類(lèi)結(jié)果,降低了人工成本。