一種虛擬人講課視頻生成方法、系統(tǒng)、裝置及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202110434673.8 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113194348A | 公開(kāi)(公告)日 | 2021-07-30 |
申請(qǐng)公布號(hào) | CN113194348A | 申請(qǐng)公布日 | 2021-07-30 |
分類號(hào) | H04N21/43(2011.01)I;H04N21/8547(2011.01)I;H04N21/44(2011.01)I;G10L13/02(2013.01)I;G06K9/00(2006.01)I;G06F40/279(2020.01)I;G06T13/40(2011.01)I | 分類 | 電通信技術(shù); |
發(fā)明人 | 李權(quán);王倫基;葉俊杰;朱杰;成秋喜;韓藍(lán)青 | 申請(qǐng)(專利權(quán))人 | 賽業(yè)(廣州)生物科技有限公司 |
代理機(jī)構(gòu) | 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 | 代理人 | ??玛?yáng) |
地址 | 510530廣東省廣州市黃埔區(qū)香雪八路98號(hào)香雪國(guó)際公寓F棟 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)一種虛擬人講課視頻生成方法、系統(tǒng)、裝置及存儲(chǔ)介質(zhì),包括:獲取講稿內(nèi)容,將講稿內(nèi)容轉(zhuǎn)換為語(yǔ)音,并根據(jù)講稿內(nèi)容生成講稿視頻;根據(jù)講稿內(nèi)容或語(yǔ)音匹配出人物動(dòng)作;將語(yǔ)音、人物動(dòng)作輸入至高清視頻人物同步唇形模型,得到與語(yǔ)音同步的人臉唇形圖像序列;將虛擬人老師形象以及人臉唇形圖像序列輸入至視頻驅(qū)動(dòng)虛擬人物模型,得到高清虛擬人講課視頻;將高清虛擬人講課視頻輸入視頻摳圖模型,得到無(wú)背景虛擬人講課視頻;將無(wú)背景虛擬人講課視頻嵌入至講稿視頻中,得到虛擬人老師講課視頻。本發(fā)明只需要一份講稿和一張?zhí)摂M人老師形象,即可生成生動(dòng)形象的虛擬人老師講課視頻,大大縮短視頻課程內(nèi)容制作與打磨的時(shí)間。本發(fā)明可廣泛應(yīng)用于教學(xué)技術(shù)領(lǐng)域內(nèi)。 |
