一種視頻字幕的提取方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202010356689.7 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN111539427A 公開(kāi)(公告)日 2020-08-14
申請(qǐng)公布號(hào) CN111539427A 申請(qǐng)公布日 2020-08-14
分類(lèi)號(hào) G06K9/32(2006.01)I;H04N21/488(2011.01)I 分類(lèi) -
發(fā)明人 李欽;王正航 申請(qǐng)(專利權(quán))人 武漢譯滿天下科技有限公司
代理機(jī)構(gòu) 武漢智權(quán)專利代理事務(wù)所(特殊普通合伙) 代理人 武漢譯滿天下科技有限公司
地址 430000湖北省武漢市東湖新技術(shù)開(kāi)發(fā)區(qū)關(guān)山大道355號(hào)光谷新世界T+寫(xiě)字樓B棟2007
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種視頻字幕的提取方法及系統(tǒng),涉及圖像處理領(lǐng)域,該方法包括選取視頻畫(huà)面中的特定區(qū)域作為字幕識(shí)別區(qū)域,并對(duì)視頻畫(huà)面中字幕顏色進(jìn)行選?。换诖_定的字幕識(shí)別區(qū)域,對(duì)視頻的每一幀畫(huà)面進(jìn)行裁剪,并基于圖像識(shí)別算法,對(duì)每一幀畫(huà)面的字幕識(shí)別區(qū)域進(jìn)行識(shí)別,以判斷每一幀畫(huà)面的字幕識(shí)別區(qū)域是否含有字幕,以及判斷前后相鄰兩幀畫(huà)面的字幕識(shí)別區(qū)域是否相似;基于判斷結(jié)果,將視頻中含有相同字幕且相鄰的幀歸為一組,并記錄每組中首尾幀的時(shí)間戳;對(duì)每組中首幀畫(huà)面的字幕識(shí)別區(qū)域進(jìn)行OCR,得到字幕,則當(dāng)前組首尾幀的時(shí)間戳為當(dāng)前得到字幕的開(kāi)始時(shí)間戳和結(jié)束時(shí)間戳,并生成字幕文件。本發(fā)明能夠有效節(jié)省視頻字幕的提取時(shí)間。??