一種實(shí)時(shí)音頻驅(qū)動(dòng)的虛擬人物口型同步控制方法

基本信息

申請(qǐng)?zhí)?/td> CN201911314031.3 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN111081270B 公開(kāi)(公告)日 2021-06-01
申請(qǐng)公布號(hào) CN111081270B 申請(qǐng)公布日 2021-06-01
分類號(hào) G10L15/02(2006.01)I;H04N21/43(2011.01)I;G10L25/57(2013.01)I;G10L21/18(2013.01)I;G10L21/10(2013.01)I 分類 樂(lè)器;聲學(xué);
發(fā)明人 朱風(fēng)云;陳博 申請(qǐng)(專利權(quán))人 大連即時(shí)智能科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 116000遼寧省大連市大連高新技術(shù)產(chǎn)業(yè)區(qū)火炬路32A號(hào)B座21層2102室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種實(shí)時(shí)音頻驅(qū)動(dòng)的虛擬人物口型同步控制方法。該方法包括如下步驟:從實(shí)時(shí)語(yǔ)音流中識(shí)別出視素概率的步驟;對(duì)所述視素概率進(jìn)行濾波的步驟;將所述視素概率的采樣率轉(zhuǎn)換為和虛擬人物渲染幀率相同的采樣率的步驟;將所述視素概率轉(zhuǎn)換為標(biāo)準(zhǔn)口型配置并進(jìn)行口型渲染的步驟。該方法可以避免要求在傳遞音頻流時(shí)同步傳遞音素序列或口型序列信息,可以顯著降低系統(tǒng)復(fù)雜性、耦合度和實(shí)現(xiàn)難度,適用于各種在顯示設(shè)備上渲染虛擬人物的應(yīng)用場(chǎng)景。??