一種視頻翻譯方法、系統(tǒng)、裝置及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202011375314.1 | 申請日 | - |
公開(公告)號 | CN112562721A | 公開(公告)日 | 2021-03-26 |
申請公布號 | CN112562721A | 申請公布日 | 2021-03-26 |
分類號 | G10L17/00(2013.01)I;G10L25/57(2013.01)I;G10L21/043(2013.01)I;G06K9/00(2006.01)I;G10L21/10(2013.01)I;G10L13/047(2013.01)I;G10L15/26(2006.01)I;G10L13/04(2013.01)I;G06F40/58(2020.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 王倫基;葉俊杰;李權(quán);成秋喜;胡玉針;李嘉雄;朱杰;韓藍青 | 申請(專利權(quán))人 | 賽業(yè)(廣州)生物科技有限公司 |
代理機構(gòu) | 廣州嘉權(quán)專利商標事務(wù)所有限公司 | 代理人 | ??玛?/td> |
地址 | 510530廣東省廣州市黃埔區(qū)香雪八路98號香雪國際公寓F棟 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種視頻翻譯方法、系統(tǒng)、裝置及存儲介質(zhì),其中方法包括以下步驟:獲取視頻數(shù)據(jù);對所述視頻數(shù)據(jù)進行語音分割,獲得語音片段以及與所述語音片段對應(yīng)的視頻片段;對所述語音片段進行語音識別,獲得第一文本,對所述第一文本進行翻譯,獲得第二文本;根據(jù)所述第二文本獲取合成語音,通過調(diào)整所述合成語音和與之對應(yīng)的所述視頻片段,使所述合成語音與所述視頻片段匹配;檢測并調(diào)整所述視頻片段中的唇形,以使所述唇形與所述合成語音同步匹配。本發(fā)明實現(xiàn)了對視頻自動翻譯的功能,能夠生成目標語言聲音的音頻,并生成聲音與唇形匹配的視頻,解決了不同語種間的交流障礙,無需人工配音,降低了翻譯成本,可廣泛應(yīng)用于視頻處理領(lǐng)域。?? |
