一種視頻字幕時間對齊方法、系統(tǒng)及存儲介質

基本信息

申請?zhí)?/td> CN202111470116.8 申請日 -
公開(公告)號 CN114143613A 公開(公告)日 2022-03-04
申請公布號 CN114143613A 申請公布日 2022-03-04
分類號 H04N21/488(2011.01)I;H04N21/845(2011.01)I;H04N21/8547(2011.01)I;G06V20/40(2022.01)I;G06V20/62(2022.01)I;G06V10/22(2022.01)I;G06V10/74(2022.01)I 分類 電通信技術;
發(fā)明人 程梓益 申請(專利權)人 北京影譜科技股份有限公司
代理機構 北京知呱呱知識產權代理有限公司 代理人 鄭興旺
地址 100125北京市朝陽區(qū)朝陽公園南路3號樓6層601內702室
法律狀態(tài) -

摘要

摘要 本申請公開了一種視頻字幕時間對齊方法、系統(tǒng)及存儲介質。該方法包括首先獲取帶字幕的原始視頻以及描述文本,其中,描述文本的內容與原始視頻中字幕的內容相對應;根據(jù)預設的取幀間隔時間截取原始視頻中的字幕區(qū)域得到字幕區(qū)域圖像集;將字幕區(qū)域圖像集輸入到OCR識別模型進行OCR識別得到帶有時間戳的OCR識別結果;將OCR識別結果與描述文本每個段落通過公共子串算法進行匹配,確定出OCR識別結果在每個段落的首句和尾句;根據(jù)每個段落的首句和尾句分別對應的時間戳確定描述文本各個段落在原始視頻中的持續(xù)時間。可以看出,本申請實施例提供的技術方案提高視頻字幕與描述文本進行時間匹配的準確性。