基于年齡向量的語(yǔ)音識(shí)別方法、裝置及設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202210055243.X 申請(qǐng)日 -
公開(公告)號(hào) CN114582326A 公開(公告)日 2022-06-03
申請(qǐng)公布號(hào) CN114582326A 申請(qǐng)公布日 2022-06-03
分類號(hào) G10L15/06;G10L15/02;G10L15/22;G10L15/30 分類 樂器;聲學(xué);
發(fā)明人 秦艷姣;楊莉;王海軍;雷建軍 申請(qǐng)(專利權(quán))人 湖北第二師范學(xué)院
代理機(jī)構(gòu) 武漢知產(chǎn)時(shí)代知識(shí)產(chǎn)權(quán)代理有限公司 代理人 馬帥
地址 430205 湖北省武漢市東湖新技術(shù)開發(fā)區(qū)高新二路129號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種基于年齡向量的語(yǔ)音識(shí)別方法、裝置及設(shè)備,該方法包括:獲取訓(xùn)練數(shù)據(jù),訓(xùn)練數(shù)據(jù)包括多條語(yǔ)音文件及對(duì)應(yīng)的標(biāo)注,標(biāo)注為語(yǔ)音文件對(duì)應(yīng)的年齡和性別;獲取預(yù)設(shè)的說話人年齡向量提取器;通過訓(xùn)練數(shù)據(jù)對(duì)說話人年齡向量提取器進(jìn)行多輪迭代訓(xùn)練,訓(xùn)練完成后,得到訓(xùn)練好的說話人年齡向量提取器;獲取說話人語(yǔ)音;將說話人語(yǔ)音輸入訓(xùn)練好的說話人年齡向量提取器,輸出說話人年齡向量;將說話人年齡向量和說話人語(yǔ)音輸入預(yù)設(shè)的聲學(xué)模型網(wǎng)絡(luò),輸出語(yǔ)音識(shí)別結(jié)果。本發(fā)明通過訓(xùn)練說話人年齡向量提取器提取說話人年齡向量,同時(shí)根據(jù)說話人年齡向量和說話人語(yǔ)音綜合進(jìn)行語(yǔ)音識(shí)別預(yù)測(cè),能夠識(shí)別不同年齡段的語(yǔ)音,且提高了語(yǔ)音識(shí)別的準(zhǔn)確率。