語音及動作驅(qū)動圖像的方法、系統(tǒng)、裝置及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202110436618.2 申請日 -
公開(公告)號 CN113179449A 公開(公告)日 2021-07-27
申請公布號 CN113179449A 申請公布日 2021-07-27
分類號 H04N21/439(2011.01)I;H04N21/44(2011.01)I;H04N21/4402(2011.01)I;H04N21/4415(2011.01)I;H04N21/81(2011.01)I;H04N5/262(2006.01)I 分類 電通信技術(shù);
發(fā)明人 王倫基;李權(quán);葉俊杰;朱杰;成秋喜;韓藍(lán)青 申請(專利權(quán))人 賽業(yè)(廣州)生物科技有限公司
代理機(jī)構(gòu) 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 代理人 ??玛?/td>
地址 510530廣東省廣州市黃埔區(qū)香雪八路98號香雪國際公寓F棟
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種語音及動作驅(qū)動圖像的方法、系統(tǒng)、裝置及存儲介質(zhì),所述方法包括:獲取語音、動作視頻及圖像;根據(jù)所述圖像提取面部特征向量,以及根據(jù)所述語音預(yù)測系列表情參數(shù);根據(jù)所述圖像及所述動作視頻確定驅(qū)動的系列關(guān)鍵點參數(shù);根據(jù)所述面部特征向量、所述驅(qū)動的系列關(guān)鍵點參數(shù)及所述系列表情參數(shù)對應(yīng)生成系列圖像;根據(jù)所述語音及所述系列圖像生成視頻文件。本發(fā)明實施例能夠驅(qū)動靜態(tài)圖像按照預(yù)設(shè)的語音及動作形成匹配的視頻文件,生動逼真,操作簡單且便于推廣。本發(fā)明實施例可廣泛應(yīng)用于圖像處理技術(shù)領(lǐng)域。