自動(dòng)識(shí)別書頁的方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201910464694.7 申請(qǐng)日 -
公開(公告)號(hào) CN110209759A 公開(公告)日 2019-09-06
申請(qǐng)公布號(hào) CN110209759A 申請(qǐng)公布日 2019-09-06
分類號(hào) G06F16/31(2019.01)I; G06F16/33(2019.01)I; G06F16/583(2019.01)I; G06K9/32(2006.01)N 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 不公告發(fā)明人 申請(qǐng)(專利權(quán))人 北京網(wǎng)梯科技發(fā)展有限公司
代理機(jī)構(gòu) - 代理人 -
地址 100098 北京市海淀區(qū)知春路甲48號(hào)盈都大廈C座四單元3B
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種自動(dòng)識(shí)別書頁的方法及裝置,所述方法使用光學(xué)字符識(shí)別技術(shù)OCR和全文檢索技術(shù)來實(shí)現(xiàn)書頁自動(dòng)定位,分為兩個(gè)大的步驟:書籍全文檢索數(shù)據(jù)庫(kù)準(zhǔn)備和頁碼自動(dòng)識(shí)別。將書頁的定位轉(zhuǎn)化為文本的OCR識(shí)別和檢索技術(shù),解決了現(xiàn)有方法存在的問題,對(duì)OCR識(shí)別的精度要求較低,部分的文本識(shí)別錯(cuò)誤不會(huì)影響整體的檢索結(jié)果。