AI主播視頻的生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202110519344.3 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113256765A | 公開(kāi)(公告)日 | 2021-08-13 |
申請(qǐng)公布號(hào) | CN113256765A | 申請(qǐng)公布日 | 2021-08-13 |
分類(lèi)號(hào) | G06T11/60(2006.01)I;G06T5/00(2006.01)I;G10L13/04(2013.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 陳達(dá)勤;宋博寧;浣軍;李曈;婁明;王淳 | 申請(qǐng)(專(zhuān)利權(quán))人 | 北京深尚科技有限公司 |
代理機(jī)構(gòu) | 成都頂峰專(zhuān)利事務(wù)所(普通合伙) | 代理人 | 王霞 |
地址 | 100000北京市海淀區(qū)海淀北二街8號(hào)5層601 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)?zhí)峁┝艘环NAI主播視頻的生成方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),涉及人工智能技術(shù)領(lǐng)域。方法包括將音頻數(shù)據(jù)和AI主播圖像作為第一模型的輸入運(yùn)算,得到第一唇形圖像序列;將第一唇形圖像序列作為第二模型的輸入運(yùn)算,得到第二唇形圖像序列;將第二唇形圖像序列與AI主播圖像進(jìn)行圖像融合,得到AI主播視頻;第一模型是以歷史音頻數(shù)據(jù)和AI主播圖像作為輸入,唇形圖像作為輸出訓(xùn)練得到的,第二模型是以第一清晰度的歷史唇形圖像序列作為輸入,第二清晰度的歷史唇形圖像序列作為輸出訓(xùn)練得到的,第二清晰度高于第一清晰度。本申請(qǐng)?zhí)峁┑姆椒?、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)可以較低成本得到高清晰度的唇形圖像,降低AI主播視頻的制作成本。 |
