語(yǔ)音驅(qū)動(dòng)圖像的方法、系統(tǒng)、裝置及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202110436595.5 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113192162A | 公開(kāi)(公告)日 | 2021-07-30 |
申請(qǐng)公布號(hào) | CN113192162A | 申請(qǐng)公布日 | 2021-07-30 |
分類號(hào) | G06T13/20(2011.01)I;G06K9/00(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G10L15/22(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 王倫基;李權(quán);葉俊杰;朱杰;成秋喜;韓藍(lán)青 | 申請(qǐng)(專利權(quán))人 | 賽業(yè)(廣州)生物科技有限公司 |
代理機(jī)構(gòu) | 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 | 代理人 | ??玛?yáng) |
地址 | 510530廣東省廣州市黃埔區(qū)香雪八路98號(hào)香雪國(guó)際公寓F棟 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種語(yǔ)音驅(qū)動(dòng)圖像的方法、系統(tǒng)、裝置及存儲(chǔ)介質(zhì),所述方法包括:獲取語(yǔ)音及圖像;根據(jù)所述圖像提取面部特征參數(shù);將所述語(yǔ)音輸入到頭部位姿及表情預(yù)測(cè)模型獲取系列動(dòng)態(tài)參數(shù);根據(jù)所述面部特征參數(shù)及所述系列動(dòng)態(tài)參數(shù)生成系列圖像;根據(jù)所述語(yǔ)音及所述系列圖像生成視頻文件。本發(fā)明實(shí)施例通過(guò)圖像提取面部特征參數(shù)實(shí)現(xiàn)對(duì)多種圖像的面部參數(shù)進(jìn)行更準(zhǔn)確的提取,通過(guò)頭部位姿及表情預(yù)測(cè)模型獲取與語(yǔ)音匹配的動(dòng)態(tài)參數(shù),通過(guò)語(yǔ)音、面部特征參數(shù)及動(dòng)態(tài)參數(shù)生成生動(dòng)逼真且與語(yǔ)音匹配的視頻文件,整個(gè)過(guò)程操作簡(jiǎn)單且便于推廣。本發(fā)明實(shí)施例可廣泛應(yīng)用于圖像處理技術(shù)領(lǐng)域。 |
