一種語音驅(qū)動人物手勢的方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN202011219858.9 申請日 -
公開(公告)號 CN112328076B 公開(公告)日 2021-10-29
申請公布號 CN112328076B 申請公布日 2021-10-29
分類號 G06F3/01(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 不公告發(fā)明人 申請(專利權)人 北京中科深智科技有限公司
代理機構(gòu) - 代理人 -
地址 100000 北京市北京經(jīng)濟技術開發(fā)區(qū)永昌中路4號院4號樓3層311A室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種語音驅(qū)動人物手勢的方法和系統(tǒng),包括如下內(nèi)容:提取語音信號中的文本特征和音頻特征;將文本特征和音頻特征輸入至自回歸模型,以通過自回歸模型預測獲取本期關節(jié)角度旋轉(zhuǎn)序列,以及將本期關節(jié)角度旋轉(zhuǎn)序列反饋至自回歸模型,以用于下期關節(jié)角度旋轉(zhuǎn)序列預測;通過本期關節(jié)角度旋轉(zhuǎn)序列生成手勢,并將手勢和語音信號合成輸出。本發(fā)明能夠同時產(chǎn)生兩種手勢,且通過設置自回歸模型的預測結(jié)構(gòu),能夠獲得連續(xù)的手勢,因此,能夠?qū)崿F(xiàn)逼真的效果,且便于用戶感知虛擬人物的情感,可以廣泛應用于虛擬代理和類人機器人。