一種視頻翻譯方法、系統(tǒng)、裝置及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202011375314.1 申請日 -
公開(公告)號 CN112562721A 公開(公告)日 2021-03-26
申請公布號 CN112562721A 申請公布日 2021-03-26
分類號 G10L17/00(2013.01)I;G10L25/57(2013.01)I;G10L21/043(2013.01)I;G06K9/00(2006.01)I;G10L21/10(2013.01)I;G10L13/047(2013.01)I;G10L15/26(2006.01)I;G10L13/04(2013.01)I;G06F40/58(2020.01)I 分類 樂器;聲學(xué);
發(fā)明人 王倫基;葉俊杰;李權(quán);成秋喜;胡玉針;李嘉雄;朱杰;韓藍青 申請(專利權(quán))人 賽業(yè)(廣州)生物科技有限公司
代理機構(gòu) 廣州嘉權(quán)專利商標事務(wù)所有限公司 代理人 ??玛?/td>
地址 510530廣東省廣州市黃埔區(qū)香雪八路98號香雪國際公寓F棟
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種視頻翻譯方法、系統(tǒng)、裝置及存儲介質(zhì),其中方法包括以下步驟:獲取視頻數(shù)據(jù);對所述視頻數(shù)據(jù)進行語音分割,獲得語音片段以及與所述語音片段對應(yīng)的視頻片段;對所述語音片段進行語音識別,獲得第一文本,對所述第一文本進行翻譯,獲得第二文本;根據(jù)所述第二文本獲取合成語音,通過調(diào)整所述合成語音和與之對應(yīng)的所述視頻片段,使所述合成語音與所述視頻片段匹配;檢測并調(diào)整所述視頻片段中的唇形,以使所述唇形與所述合成語音同步匹配。本發(fā)明實現(xiàn)了對視頻自動翻譯的功能,能夠生成目標語言聲音的音頻,并生成聲音與唇形匹配的視頻,解決了不同語種間的交流障礙,無需人工配音,降低了翻譯成本,可廣泛應(yīng)用于視頻處理領(lǐng)域。??