一種視頻字幕時(shí)間對齊方法、系統(tǒng)及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202111470116.8 | 申請日 | - |
公開(公告)號 | CN114143613A | 公開(公告)日 | 2022-03-04 |
申請公布號 | CN114143613A | 申請公布日 | 2022-03-04 |
分類號 | H04N21/488(2011.01)I;H04N21/845(2011.01)I;H04N21/8547(2011.01)I;G06V20/40(2022.01)I;G06V20/62(2022.01)I;G06V10/22(2022.01)I;G06V10/74(2022.01)I | 分類 | 電通信技術(shù); |
發(fā)明人 | 程梓益 | 申請(專利權(quán))人 | 北京影譜科技股份有限公司 |
代理機(jī)構(gòu) | 北京知呱呱知識產(chǎn)權(quán)代理有限公司 | 代理人 | 鄭興旺 |
地址 | 100125北京市朝陽區(qū)朝陽公園南路3號樓6層601內(nèi)702室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了一種視頻字幕時(shí)間對齊方法、系統(tǒng)及存儲介質(zhì)。該方法包括首先獲取帶字幕的原始視頻以及描述文本,其中,描述文本的內(nèi)容與原始視頻中字幕的內(nèi)容相對應(yīng);根據(jù)預(yù)設(shè)的取幀間隔時(shí)間截取原始視頻中的字幕區(qū)域得到字幕區(qū)域圖像集;將字幕區(qū)域圖像集輸入到OCR識別模型進(jìn)行OCR識別得到帶有時(shí)間戳的OCR識別結(jié)果;將OCR識別結(jié)果與描述文本每個(gè)段落通過公共子串算法進(jìn)行匹配,確定出OCR識別結(jié)果在每個(gè)段落的首句和尾句;根據(jù)每個(gè)段落的首句和尾句分別對應(yīng)的時(shí)間戳確定描述文本各個(gè)段落在原始視頻中的持續(xù)時(shí)間??梢钥闯觯旧暾垖?shí)施例提供的技術(shù)方案提高視頻字幕與描述文本進(jìn)行時(shí)間匹配的準(zhǔn)確性。 |
