一種基于實(shí)時(shí)人臉輔助的語音端點(diǎn)檢測方法
基本信息
申請(qǐng)?zhí)?/td> | CN202110346035.0 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113160853A | 公開(公告)日 | 2021-07-23 |
申請(qǐng)公布號(hào) | CN113160853A | 申請(qǐng)公布日 | 2021-07-23 |
分類號(hào) | G10L25/78;G10L15/05;G10L15/04;G10L15/02;G06K9/00 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 魚海航 | 申請(qǐng)(專利權(quán))人 | 深圳魚亮科技有限公司 |
代理機(jī)構(gòu) | 合肥律眾知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 殷娟 |
地址 | 518101 廣東省深圳市寶安區(qū)西鄉(xiāng)街道富華社區(qū)富瑰路富瑰園C棟1單元401 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于實(shí)時(shí)人臉輔助的語音端點(diǎn)檢測方法,具體涉及語音識(shí)別技術(shù)領(lǐng)域,包括以下步驟:通過實(shí)時(shí)圖像錄取設(shè)備,獲取用戶面部的實(shí)時(shí)影像信息,并將影像信息傳輸至后臺(tái)的控制中心,利用圖像處理技術(shù),對(duì)影像信息進(jìn)行特征提取,獲取影像信息中與用戶面部相關(guān)的動(dòng)作幀;提取用戶面部特征,根據(jù)面部特征,確定數(shù)量不同的基準(zhǔn)點(diǎn),利用基準(zhǔn)點(diǎn)構(gòu)建用戶的面部動(dòng)作數(shù)據(jù)庫,每個(gè)特定的面部動(dòng)作由數(shù)個(gè)基準(zhǔn)點(diǎn)組成,將上述獲取的動(dòng)作幀與面部動(dòng)作數(shù)據(jù)庫中的面部特征進(jìn)行對(duì)比。本發(fā)明極大的降低了進(jìn)行語音端點(diǎn)檢測過程中的操作程序,也使進(jìn)行處理的語音信息總量得到了減少,從而提升了語音端點(diǎn)檢測的速率,提高了實(shí)用性。 |
