一種實時音頻驅(qū)動的虛擬人物口型同步控制方法

基本信息

申請?zhí)?/td> CN201911314031.3 申請日 -
公開(公告)號 CN111081270A 公開(公告)日 2021-06-01
申請公布號 CN111081270A 申請公布日 2021-06-01
分類號 G10L21/10;G10L21/18;G10L25/57;G10L15/02;H04N21/43 分類 樂器;聲學(xué);
發(fā)明人 朱風(fēng)云;陳博 申請(專利權(quán))人 大連即時智能科技有限公司
代理機構(gòu) - 代理人 -
地址 116000 遼寧省大連市大連高新技術(shù)產(chǎn)業(yè)區(qū)火炬路32A號B座21層2102室
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于虛擬人物姿態(tài)控制領(lǐng)域,具體涉及一種實時音頻驅(qū)動的虛擬人物口型同步控制方法。該方法包括如下步驟:從實時語音流中識別出視素概率的步驟;對所述視素概率進(jìn)行濾波的步驟;將所述視素概率的采樣率轉(zhuǎn)換為和虛擬人物渲染幀率相同的采樣率的步驟;將所述視素概率轉(zhuǎn)換為標(biāo)準(zhǔn)口型配置并進(jìn)行口型渲染的步驟。該方法可以避免要求在傳遞音頻流時同步傳遞音素序列或口型序列信息,可以顯著降低系統(tǒng)復(fù)雜性、耦合度和實現(xiàn)難度,適用于各種在顯示設(shè)備上渲染虛擬人物的應(yīng)用場景。