視頻字幕添加方法、裝置、計算設備及計算機存儲介質

基本信息

申請?zhí)?/td> CN202110677601.6 申請日 -
公開(公告)號 CN113326844A 公開(公告)日 2021-08-31
申請公布號 CN113326844A 申請公布日 2021-08-31
分類號 G06K9/32(2006.01)I;G06K9/34(2006.01)I;G06K9/46(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 郭寶 申請(專利權)人 咪咕數(shù)字傳媒有限公司
代理機構 北京市浩天知識產(chǎn)權代理事務所(普通合伙) 代理人 張穎瑛
地址 310018浙江省杭州市西湖區(qū)西溪銀座1幢1層101室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種視頻字幕添加方法、裝置、計算設備及計算機存儲介質。方法包括:識別視頻幀中的發(fā)音對象及對話對象,確定發(fā)音對象本體區(qū)域、對話對象本體區(qū)域以及對話對象關聯(lián)區(qū)域,根據(jù)發(fā)音對象本體區(qū)域、對話對象本體區(qū)域以及對話對象關聯(lián)區(qū)域確定發(fā)音對象對應的視頻字幕的禁示區(qū)域,繼而根據(jù)禁示區(qū)域確定發(fā)音對象對應的視頻字幕的顯示區(qū)域,最終將發(fā)音對象對應的視頻字幕添加至顯示區(qū)域。采用本方案,視頻字幕無法遮擋發(fā)音對象及對話對象,從而提升用戶觀看體驗;并且能夠避免用戶對視頻字幕所對應的發(fā)音對象產(chǎn)生混淆,便于用戶分辨視頻字幕所對應的發(fā)音對象,以及便于用戶準確地理解視頻內(nèi)容,繼而提升用戶體驗。