一種視頻OSD字符識(shí)別方法、裝置及介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202210446762.9 申請(qǐng)日 -
公開(公告)號(hào) CN114782941A 公開(公告)日 2022-07-22
申請(qǐng)公布號(hào) CN114782941A 申請(qǐng)公布日 2022-07-22
分類號(hào) G06V20/62(2022.01)I;G06V30/10(2022.01)I;G06V30/148(2022.01)I;G06V10/44(2022.01)I;G06V10/764(2022.01)I;G06V10/82(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 凌康杰;陳利軍;林煥凱;洪曙光;王祥雪;劉雙廣 申請(qǐng)(專利權(quán))人 高新興科技集團(tuán)股份有限公司
代理機(jī)構(gòu) 廣州國(guó)鵬知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 -
地址 510530廣東省廣州市黃埔區(qū)科學(xué)城開創(chuàng)大道2819號(hào)六樓
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種視頻OSD字符識(shí)別方法,其包括如下步驟:S1,獲取OSD視頻圖像;S2,OSD視頻圖像輸入至字符位置檢測(cè)模塊,得到字符位置信息;S3,將所述字符位置信息和所述OSD視頻圖像同時(shí)輸入至字符位置裁剪模塊,得到裁剪后的圖像;所述字符位置裁剪模塊對(duì)所述OSD視頻圖像中字符圖像塊的中心坐標(biāo)隨機(jī)偏移M個(gè)字符長(zhǎng)度;S4,將所述裁剪后的圖像輸入至字符內(nèi)容識(shí)別模塊,輸出識(shí)別到的字符串信息。本發(fā)明在識(shí)別字符過(guò)程中,同時(shí)使用了OSD字符的位置信息,可以加快模型收斂,提高識(shí)別的精度。