一種視頻OSD字符識(shí)別方法、裝置及介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202210446762.9 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN114782941A | 公開(公告)日 | 2022-07-22 |
申請(qǐng)公布號(hào) | CN114782941A | 申請(qǐng)公布日 | 2022-07-22 |
分類號(hào) | G06V20/62(2022.01)I;G06V30/10(2022.01)I;G06V30/148(2022.01)I;G06V10/44(2022.01)I;G06V10/764(2022.01)I;G06V10/82(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 凌康杰;陳利軍;林煥凱;洪曙光;王祥雪;劉雙廣 | 申請(qǐng)(專利權(quán))人 | 高新興科技集團(tuán)股份有限公司 |
代理機(jī)構(gòu) | 廣州國(guó)鵬知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | - |
地址 | 510530廣東省廣州市黃埔區(qū)科學(xué)城開創(chuàng)大道2819號(hào)六樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種視頻OSD字符識(shí)別方法,其包括如下步驟:S1,獲取OSD視頻圖像;S2,OSD視頻圖像輸入至字符位置檢測(cè)模塊,得到字符位置信息;S3,將所述字符位置信息和所述OSD視頻圖像同時(shí)輸入至字符位置裁剪模塊,得到裁剪后的圖像;所述字符位置裁剪模塊對(duì)所述OSD視頻圖像中字符圖像塊的中心坐標(biāo)隨機(jī)偏移M個(gè)字符長(zhǎng)度;S4,將所述裁剪后的圖像輸入至字符內(nèi)容識(shí)別模塊,輸出識(shí)別到的字符串信息。本發(fā)明在識(shí)別字符過(guò)程中,同時(shí)使用了OSD字符的位置信息,可以加快模型收斂,提高識(shí)別的精度。 |
