一種字幕顯示方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN202111142751.3 申請(qǐng)日 -
公開(公告)號(hào) CN113660536A 公開(公告)日 2021-11-16
申請(qǐng)公布號(hào) CN113660536A 申請(qǐng)公布日 2021-11-16
分類號(hào) H04N21/488(2011.01)I;G10L15/26(2006.01)I;G06K9/32(2006.01)I;G06K9/00(2006.01)I 分類 電通信技術(shù);
發(fā)明人 殷元江;徐平;馬添翼 申請(qǐng)(專利權(quán))人 北京七維視覺科技有限公司
代理機(jī)構(gòu) 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 代理人 付麗
地址 100013北京市東城區(qū)和平里東街11號(hào)3號(hào)樓2-A1號(hào)
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┝艘环N字幕顯示方法和裝置,方法包括:檢測(cè)目標(biāo)視頻中是否有在說話的目標(biāo)人物,在檢測(cè)到有在說話的目標(biāo)人物時(shí),開始獲取目標(biāo)視頻的語音識(shí)別結(jié)果,直至檢測(cè)到目標(biāo)人物不再說話,根據(jù)獲取的語音識(shí)別結(jié)果生成目標(biāo)人物對(duì)應(yīng)的字幕信息,以得到目標(biāo)視頻中每個(gè)說話人對(duì)應(yīng)的字幕信息,將目標(biāo)視頻中每個(gè)說話人對(duì)應(yīng)的字幕信息與對(duì)應(yīng)的說話人進(jìn)行關(guān)聯(lián)顯示,并在顯示每個(gè)說話人對(duì)應(yīng)的字幕信息時(shí),按對(duì)應(yīng)說話人對(duì)應(yīng)的字幕樣式進(jìn)行顯示。本申請(qǐng)能生成目標(biāo)視頻中所包含的各說話人分別對(duì)應(yīng)的字幕信息,并能將每個(gè)說話人對(duì)應(yīng)的字幕信息與對(duì)應(yīng)的說話人進(jìn)行關(guān)聯(lián)顯示,在顯示時(shí),還能使目標(biāo)視頻中各說話人對(duì)應(yīng)的字幕信息的字幕樣式差異化,以提升用戶體驗(yàn)。