一種基于拼接特征的語種識別方法
基本信息
申請?zhí)?/td> | CN202010244083.4 | 申請日 | - |
公開(公告)號 | CN111599344A | 公開(公告)日 | 2020-08-28 |
申請公布號 | CN111599344A | 申請公布日 | 2020-08-28 |
分類號 | G10L15/00;G10L15/02;G10L15/06 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 劉俊南;江海;王化;劉文龍 | 申請(專利權(quán))人 | 因諾微科技(天津)有限公司 |
代理機構(gòu) | 天津市北洋有限責(zé)任專利代理事務(wù)所 | 代理人 | 李素蘭 |
地址 | 300392 天津市濱海新區(qū)華苑產(chǎn)業(yè)區(qū)(環(huán)外)海泰發(fā)展五道16號B-6號樓-1-502 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于拼接特征的語種識別方法,步驟1,獲得語音信號的幀序列;步驟2,計算時長特征;步驟3,提取語音幀序列的底層聲學(xué)特征;步驟4,得到音素特征序列;步驟5,獲得拼接特征;步驟6,將拼接特征輸入到i?vector提取器中,提取得到語音幀序列的i?vector特征表示;步驟7,得到lda?vector特征;步驟8,將lda?vector特征輸入到訓(xùn)練好的分類器中,獲得輸入語音幀序列的語種標(biāo)簽。與現(xiàn)有技術(shù)相比,本發(fā)明結(jié)合了高層和底層聲學(xué)特征這兩種特征的優(yōu)點;無需訓(xùn)練多個音素識別器,只需要提取高層聲學(xué)特征;降低復(fù)雜度的同時,提高對語音信號的語種識別性能特別是語種識別準(zhǔn)確率。 |
