基于年齡向量的語音識別方法、裝置及設(shè)備

基本信息

申請?zhí)?/td> CN202210055243.X 申請日 -
公開(公告)號 CN114582326A 公開(公告)日 2022-06-03
申請公布號 CN114582326A 申請公布日 2022-06-03
分類號 G10L15/06;G10L15/02;G10L15/22;G10L15/30 分類 樂器;聲學(xué);
發(fā)明人 秦艷姣;楊莉;王海軍;雷建軍 申請(專利權(quán))人 湖北第二師范學(xué)院
代理機(jī)構(gòu) 武漢知產(chǎn)時(shí)代知識產(chǎn)權(quán)代理有限公司 代理人 馬帥
地址 430205 湖北省武漢市東湖新技術(shù)開發(fā)區(qū)高新二路129號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于年齡向量的語音識別方法、裝置及設(shè)備,該方法包括:獲取訓(xùn)練數(shù)據(jù),訓(xùn)練數(shù)據(jù)包括多條語音文件及對應(yīng)的標(biāo)注,標(biāo)注為語音文件對應(yīng)的年齡和性別;獲取預(yù)設(shè)的說話人年齡向量提取器;通過訓(xùn)練數(shù)據(jù)對說話人年齡向量提取器進(jìn)行多輪迭代訓(xùn)練,訓(xùn)練完成后,得到訓(xùn)練好的說話人年齡向量提取器;獲取說話人語音;將說話人語音輸入訓(xùn)練好的說話人年齡向量提取器,輸出說話人年齡向量;將說話人年齡向量和說話人語音輸入預(yù)設(shè)的聲學(xué)模型網(wǎng)絡(luò),輸出語音識別結(jié)果。本發(fā)明通過訓(xùn)練說話人年齡向量提取器提取說話人年齡向量,同時(shí)根據(jù)說話人年齡向量和說話人語音綜合進(jìn)行語音識別預(yù)測,能夠識別不同年齡段的語音,且提高了語音識別的準(zhǔn)確率。