一種基于動作及語音特征的人臉圖像動畫方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN202210115682.5 申請日 -
公開(公告)號 CN114445529A 公開(公告)日 2022-05-06
申請公布號 CN114445529A 申請公布日 2022-05-06
分類號 G06T13/40(2011.01)I;G06V20/40(2022.01)I;G06V40/16(2022.01)I;G06V40/20(2022.01)I;G10L15/06(2013.01)I 分類 計算;推算;計數(shù);
發(fā)明人 楊磊 申請(專利權(quán))人 北京中科深智科技有限公司
代理機構(gòu) - 代理人 -
地址 100000北京市大興區(qū)北京經(jīng)濟技術(shù)開發(fā)區(qū)永昌中路4號院4號樓3層311A室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于動作及語音特征的人臉圖像動畫方法和系統(tǒng),包括:圖像驅(qū)動方式及語音驅(qū)動方式;其中圖像驅(qū)動方式為:輸入一個人臉的談話視頻和另一個人的人臉,得到另一個人原本是靜態(tài)圖片的動態(tài)圖像視頻;語音驅(qū)動方式為:針對某個特定人物進行訓練,當使用另一個人的特征進行預測的時候,對特征進行一步轉(zhuǎn)化,將其轉(zhuǎn)化為被訓練的人的聲音特征,將聲音特征進行人臉特征轉(zhuǎn)化,獲取人臉圖像動畫。本發(fā)明能夠?qū)崿F(xiàn)視頻與音頻的兩種驅(qū)動方式對目標人物進行驅(qū)動,驅(qū)動方式多樣,可以滿足多種需求。