視頻字幕添加方法、裝置、計算設備及計算機存儲介質
基本信息
申請?zhí)?/td> | CN202110677601.6 | 申請日 | - |
公開(公告)號 | CN113326844A | 公開(公告)日 | 2021-08-31 |
申請公布號 | CN113326844A | 申請公布日 | 2021-08-31 |
分類號 | G06K9/32(2006.01)I;G06K9/34(2006.01)I;G06K9/46(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 郭寶 | 申請(專利權)人 | 咪咕數(shù)字傳媒有限公司 |
代理機構 | 北京市浩天知識產(chǎn)權代理事務所(普通合伙) | 代理人 | 張穎瑛 |
地址 | 310018浙江省杭州市西湖區(qū)西溪銀座1幢1層101室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種視頻字幕添加方法、裝置、計算設備及計算機存儲介質。方法包括:識別視頻幀中的發(fā)音對象及對話對象,確定發(fā)音對象本體區(qū)域、對話對象本體區(qū)域以及對話對象關聯(lián)區(qū)域,根據(jù)發(fā)音對象本體區(qū)域、對話對象本體區(qū)域以及對話對象關聯(lián)區(qū)域確定發(fā)音對象對應的視頻字幕的禁示區(qū)域,繼而根據(jù)禁示區(qū)域確定發(fā)音對象對應的視頻字幕的顯示區(qū)域,最終將發(fā)音對象對應的視頻字幕添加至顯示區(qū)域。采用本方案,視頻字幕無法遮擋發(fā)音對象及對話對象,從而提升用戶觀看體驗;并且能夠避免用戶對視頻字幕所對應的發(fā)音對象產(chǎn)生混淆,便于用戶分辨視頻字幕所對應的發(fā)音對象,以及便于用戶準確地理解視頻內(nèi)容,繼而提升用戶體驗。 |
