基于共振峰的口型表情動畫生成方法、裝置及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202011618339.X | 申請日 | - |
公開(公告)號 | CN112700520A | 公開(公告)日 | 2021-04-23 |
申請公布號 | CN112700520A | 申請公布日 | 2021-04-23 |
分類號 | G06T13/20;G06T13/40;G10L19/032 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 吳強;季曉楓;施恩銘;馬俊;郭翔 | 申請(專利權(quán))人 | 上海幻維數(shù)碼創(chuàng)意科技股份有限公司 |
代理機構(gòu) | 上??剖⒅R產(chǎn)權(quán)代理有限公司 | 代理人 | 趙繼明 |
地址 | 200072 上海市靜安區(qū)廣中西路777弄13號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于共振峰的口型表情動畫生成方法、裝置及存儲介質(zhì),方法包括以下步驟:對音頻信號進行分幀處理;進行快速傅里葉變換,得到每個語音幀的頻譜,獲取每個語音幀的共振峰數(shù)據(jù);基于共振峰數(shù)據(jù)得到每個語音幀對應(yīng)的控制字;替換控制序列中的奇異點,得到元音序列,基于元音序列,生成口型動畫和表情動畫。與現(xiàn)有技術(shù)相比,本發(fā)明基于共振峰數(shù)據(jù),得到每個聲音幀對應(yīng)的元音,再通過替換奇異點,可以減少抖動,口型和表情的變化更加自然流暢,保證了視覺效果,提升了用戶體驗;每次自元音序列中讀取多個控制字,將出現(xiàn)次數(shù)最多的控制字作為目標(biāo)控制字,進一步抑制了因聲音突變而造成的口型和表情突變。 |
