語(yǔ)音驅(qū)動(dòng)圖像的方法、系統(tǒng)、裝置及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110436595.5 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113192162A 公開(kāi)(公告)日 2021-07-30
申請(qǐng)公布號(hào) CN113192162A 申請(qǐng)公布日 2021-07-30
分類號(hào) G06T13/20(2011.01)I;G06K9/00(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G10L15/22(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王倫基;李權(quán);葉俊杰;朱杰;成秋喜;韓藍(lán)青 申請(qǐng)(專利權(quán))人 賽業(yè)(廣州)生物科技有限公司
代理機(jī)構(gòu) 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 代理人 ??玛?yáng)
地址 510530廣東省廣州市黃埔區(qū)香雪八路98號(hào)香雪國(guó)際公寓F棟
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種語(yǔ)音驅(qū)動(dòng)圖像的方法、系統(tǒng)、裝置及存儲(chǔ)介質(zhì),所述方法包括:獲取語(yǔ)音及圖像;根據(jù)所述圖像提取面部特征參數(shù);將所述語(yǔ)音輸入到頭部位姿及表情預(yù)測(cè)模型獲取系列動(dòng)態(tài)參數(shù);根據(jù)所述面部特征參數(shù)及所述系列動(dòng)態(tài)參數(shù)生成系列圖像;根據(jù)所述語(yǔ)音及所述系列圖像生成視頻文件。本發(fā)明實(shí)施例通過(guò)圖像提取面部特征參數(shù)實(shí)現(xiàn)對(duì)多種圖像的面部參數(shù)進(jìn)行更準(zhǔn)確的提取,通過(guò)頭部位姿及表情預(yù)測(cè)模型獲取與語(yǔ)音匹配的動(dòng)態(tài)參數(shù),通過(guò)語(yǔ)音、面部特征參數(shù)及動(dòng)態(tài)參數(shù)生成生動(dòng)逼真且與語(yǔ)音匹配的視頻文件,整個(gè)過(guò)程操作簡(jiǎn)單且便于推廣。本發(fā)明實(shí)施例可廣泛應(yīng)用于圖像處理技術(shù)領(lǐng)域。