一種視頻字幕時(shí)間對(duì)齊模型訓(xùn)練方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202111470819.0 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN114222193A | 公開(公告)日 | 2022-03-22 |
申請(qǐng)公布號(hào) | CN114222193A | 申請(qǐng)公布日 | 2022-03-22 |
分類號(hào) | H04N21/488(2011.01)I;H04N21/435(2011.01)I;G06V30/148(2022.01)I;G06V30/19(2022.01)I | 分類 | 電通信技術(shù); |
發(fā)明人 | 程梓益 | 申請(qǐng)(專利權(quán))人 | 北京影譜科技股份有限公司 |
代理機(jī)構(gòu) | 北京知呱呱知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 鄭興旺 |
地址 | 100125北京市朝陽(yáng)區(qū)朝陽(yáng)公園南路3號(hào)樓6層601內(nèi)702室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開了一種視頻字幕時(shí)間對(duì)齊模型訓(xùn)練方法及系統(tǒng),該方法首先獲取帶字幕的原始視頻集以及描述文本集;將原始視頻集與對(duì)應(yīng)的描述文本集依次通過公共子串算法進(jìn)行匹配,確定出描述文本集中各個(gè)段落所對(duì)應(yīng)的OCR識(shí)別結(jié)果;根據(jù)每段文本以及該段文本對(duì)應(yīng)的OCR識(shí)別結(jié)果形成數(shù)據(jù)集,并對(duì)數(shù)據(jù)集進(jìn)行標(biāo)注得到訓(xùn)練集;構(gòu)建基于文本語義相似度匹配的視頻字幕時(shí)間對(duì)齊模型,利用訓(xùn)練集對(duì)視頻字幕時(shí)間對(duì)齊模型進(jìn)行訓(xùn)練,得到訓(xùn)練完成的視頻字幕時(shí)間對(duì)齊模型??梢钥闯?,本申請(qǐng)實(shí)施例提供的視頻字幕時(shí)間對(duì)齊模型解決了由于錯(cuò)別字,生僻字以及視頻背景干擾的存在而產(chǎn)生的視頻字幕時(shí)間匹配問題,相比于現(xiàn)有公共子串算法能夠更加準(zhǔn)確。 |
