基于年齡向量的語音識別方法、裝置及設(shè)備
基本信息
申請?zhí)?/td> | CN202210055243.X | 申請日 | - |
公開(公告)號 | CN114582326A | 公開(公告)日 | 2022-06-03 |
申請公布號 | CN114582326A | 申請公布日 | 2022-06-03 |
分類號 | G10L15/06;G10L15/02;G10L15/22;G10L15/30 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 秦艷姣;楊莉;王海軍;雷建軍 | 申請(專利權(quán))人 | 湖北第二師范學(xué)院 |
代理機(jī)構(gòu) | 武漢知產(chǎn)時(shí)代知識產(chǎn)權(quán)代理有限公司 | 代理人 | 馬帥 |
地址 | 430205 湖北省武漢市東湖新技術(shù)開發(fā)區(qū)高新二路129號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種基于年齡向量的語音識別方法、裝置及設(shè)備,該方法包括:獲取訓(xùn)練數(shù)據(jù),訓(xùn)練數(shù)據(jù)包括多條語音文件及對應(yīng)的標(biāo)注,標(biāo)注為語音文件對應(yīng)的年齡和性別;獲取預(yù)設(shè)的說話人年齡向量提取器;通過訓(xùn)練數(shù)據(jù)對說話人年齡向量提取器進(jìn)行多輪迭代訓(xùn)練,訓(xùn)練完成后,得到訓(xùn)練好的說話人年齡向量提取器;獲取說話人語音;將說話人語音輸入訓(xùn)練好的說話人年齡向量提取器,輸出說話人年齡向量;將說話人年齡向量和說話人語音輸入預(yù)設(shè)的聲學(xué)模型網(wǎng)絡(luò),輸出語音識別結(jié)果。本發(fā)明通過訓(xùn)練說話人年齡向量提取器提取說話人年齡向量,同時(shí)根據(jù)說話人年齡向量和說話人語音綜合進(jìn)行語音識別預(yù)測,能夠識別不同年齡段的語音,且提高了語音識別的準(zhǔn)確率。 |
