一種基于拼接特征的語種識別方法

基本信息

申請?zhí)?/td> CN202010244083.4 申請日 -
公開(公告)號 CN111599344A 公開(公告)日 2020-08-28
申請公布號 CN111599344A 申請公布日 2020-08-28
分類號 G10L15/00;G10L15/02;G10L15/06 分類 樂器;聲學(xué);
發(fā)明人 劉俊南;江海;王化;劉文龍 申請(專利權(quán))人 因諾微科技(天津)有限公司
代理機構(gòu) 天津市北洋有限責(zé)任專利代理事務(wù)所 代理人 李素蘭
地址 300392 天津市濱海新區(qū)華苑產(chǎn)業(yè)區(qū)(環(huán)外)海泰發(fā)展五道16號B-6號樓-1-502
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于拼接特征的語種識別方法,步驟1,獲得語音信號的幀序列;步驟2,計算時長特征;步驟3,提取語音幀序列的底層聲學(xué)特征;步驟4,得到音素特征序列;步驟5,獲得拼接特征;步驟6,將拼接特征輸入到i?vector提取器中,提取得到語音幀序列的i?vector特征表示;步驟7,得到lda?vector特征;步驟8,將lda?vector特征輸入到訓(xùn)練好的分類器中,獲得輸入語音幀序列的語種標(biāo)簽。與現(xiàn)有技術(shù)相比,本發(fā)明結(jié)合了高層和底層聲學(xué)特征這兩種特征的優(yōu)點;無需訓(xùn)練多個音素識別器,只需要提取高層聲學(xué)特征;降低復(fù)雜度的同時,提高對語音信號的語種識別性能特別是語種識別準(zhǔn)確率。