一種長文本資料的文本識別方法

基本信息

申請?zhí)?/td> CN202210245889.4 申請日 -
公開(公告)號 CN114359889B 公開(公告)日 2022-06-21
申請公布號 CN114359889B 申請公布日 2022-06-21
分類號 G06V20/62;G06V10/24;G06V30/12;G06N3/04;G06N3/08 分類 計算;推算;計數(shù);
發(fā)明人 杜博文 申請(專利權(quán))人 北京智源人工智能研究院
代理機(jī)構(gòu) 北京動力號知識產(chǎn)權(quán)代理有限公司 代理人 梁艷
地址 100084 北京市海淀區(qū)中關(guān)村東路1號院8號樓三層B201D-1
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種長文本資料的文本識別方法,包括:獲取長文本資料的待檢測圖像;使用用于檢測長文本的場景文字檢測模型對所述待檢測圖像中的文本進(jìn)行文本框檢測,獲取多個預(yù)測點(diǎn)及各預(yù)測點(diǎn)對應(yīng)的文本框;根據(jù)各個所述文本框內(nèi)的文本行識別所述待檢測圖像的扭曲狀態(tài)是否超過預(yù)設(shè)狀態(tài),若是,則對該待檢測圖像進(jìn)行扭曲矯正;對扭曲矯正后的待檢測圖像進(jìn)行文本識別。解決了長文本圖像文本檢測效果差的問題,而且實(shí)現(xiàn)了對扭曲文本的檢測和矯正,很好的適應(yīng)了復(fù)雜場景下圖像的文本檢測,并保證和提高了文本檢測的準(zhǔn)確度,為實(shí)現(xiàn)準(zhǔn)確的文本識別奠定了基礎(chǔ);適應(yīng)了對用戶不專業(yè)拍攝生成的圖像進(jìn)行文本檢測的場景,提高了用戶的使用體驗,易于推廣應(yīng)用。