一種基于時(shí)序卷積的語(yǔ)音驅(qū)動(dòng)口型的方法和系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202210116972.1 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN114495908A 公開(kāi)(公告)日 2022-05-13
申請(qǐng)公布號(hào) CN114495908A 申請(qǐng)公布日 2022-05-13
分類(lèi)號(hào) G10L15/02(2006.01)I;G10L15/16(2006.01)I;G10L25/18(2013.01)I;G10L25/30(2013.01)I;G10L25/45(2013.01)I 分類(lèi) 樂(lè)器;聲學(xué);
發(fā)明人 王松坡 申請(qǐng)(專(zhuān)利權(quán))人 北京中科深智科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 100000北京市大興區(qū)北京經(jīng)濟(jì)技術(shù)開(kāi)發(fā)區(qū)永昌中路4號(hào)院4號(hào)樓3層311A室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種基于時(shí)序卷積的語(yǔ)音驅(qū)動(dòng)口型的方法和系統(tǒng),包括:采用blendshape來(lái)表示嘴部的動(dòng)作,通過(guò)神經(jīng)網(wǎng)絡(luò)輸出多個(gè)blendshape的權(quán)重,通過(guò)組合這些blendshape的值,得到嘴部動(dòng)作的合理表示;嘴部動(dòng)作的合理表示需要進(jìn)行離散化,離散化的聲音信號(hào)為時(shí)域信號(hào),將時(shí)域信號(hào)經(jīng)過(guò)傅里葉變換轉(zhuǎn)換到頻域中,完成特征轉(zhuǎn)換。本發(fā)明引入了時(shí)序卷積,將時(shí)序卷積網(wǎng)絡(luò)用于處理語(yǔ)音頻譜特征,較好的解決了時(shí)序信息依賴(lài)和生成模式單一的問(wèn)題。