AI主播視頻的生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110519344.3 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113256765A 公開(kāi)(公告)日 2021-08-13
申請(qǐng)公布號(hào) CN113256765A 申請(qǐng)公布日 2021-08-13
分類(lèi)號(hào) G06T11/60(2006.01)I;G06T5/00(2006.01)I;G10L13/04(2013.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陳達(dá)勤;宋博寧;浣軍;李曈;婁明;王淳 申請(qǐng)(專(zhuān)利權(quán))人 北京深尚科技有限公司
代理機(jī)構(gòu) 成都頂峰專(zhuān)利事務(wù)所(普通合伙) 代理人 王霞
地址 100000北京市海淀區(qū)海淀北二街8號(hào)5層601
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┝艘环NAI主播視頻的生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),涉及人工智能技術(shù)領(lǐng)域。方法包括將音頻數(shù)據(jù)和AI主播圖像作為第一模型的輸入運(yùn)算,得到第一唇形圖像序列;將第一唇形圖像序列作為第二模型的輸入運(yùn)算,得到第二唇形圖像序列;將第二唇形圖像序列與AI主播圖像進(jìn)行圖像融合,得到AI主播視頻;第一模型是以歷史音頻數(shù)據(jù)和AI主播圖像作為輸入,唇形圖像作為輸出訓(xùn)練得到的,第二模型是以第一清晰度的歷史唇形圖像序列作為輸入,第二清晰度的歷史唇形圖像序列作為輸出訓(xùn)練得到的,第二清晰度高于第一清晰度。本申請(qǐng)?zhí)峁┑姆椒?、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)可以較低成本得到高清晰度的唇形圖像,降低AI主播視頻的制作成本。