一種語(yǔ)音數(shù)據(jù)的識(shí)別方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202011578798.X 申請(qǐng)日 -
公開(公告)號(hào) CN112786051A 公開(公告)日 2021-05-11
申請(qǐng)公布號(hào) CN112786051A 申請(qǐng)公布日 2021-05-11
分類號(hào) G10L15/26;G10L15/18 分類 樂器;聲學(xué);
發(fā)明人 楊超;陳曉宇;張彬彬;曾晨晨 申請(qǐng)(專利權(quán))人 出門問問(蘇州)信息科技有限公司
代理機(jī)構(gòu) 北京樂知新創(chuàng)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 劉婧
地址 215000 江蘇省蘇州市蘇州工業(yè)園區(qū)星湖街328號(hào)創(chuàng)意產(chǎn)業(yè)園4-B404單元
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種語(yǔ)音數(shù)據(jù)的識(shí)別方法及裝置,該方法包括:采集第一語(yǔ)音訓(xùn)練集,根據(jù)第一語(yǔ)音訓(xùn)練集得到一級(jí)語(yǔ)音識(shí)別模型;采集第一語(yǔ)音評(píng)估集,對(duì)應(yīng)第一文本數(shù)據(jù)集;對(duì)第一語(yǔ)音評(píng)估集分別從預(yù)設(shè)的多個(gè)維度進(jìn)行變換處理,得到多個(gè)語(yǔ)音評(píng)估集;使用一級(jí)語(yǔ)音識(shí)別模型分別對(duì)多個(gè)語(yǔ)音評(píng)估集進(jìn)行識(shí)別,得到多個(gè)文本數(shù)據(jù)集;將多個(gè)文本數(shù)據(jù)集與第一文本數(shù)據(jù)集進(jìn)行比對(duì),得到多個(gè)語(yǔ)音文本識(shí)別錯(cuò)誤率;根據(jù)多個(gè)語(yǔ)音文本識(shí)別錯(cuò)誤率確定使用對(duì)應(yīng)維度對(duì)第一語(yǔ)音訓(xùn)練集進(jìn)行變換處理的占比;根據(jù)多個(gè)占比對(duì)第一語(yǔ)音訓(xùn)練集中相應(yīng)數(shù)量的語(yǔ)音樣本數(shù)據(jù)進(jìn)行變換處理得到第二語(yǔ)音訓(xùn)練集;使用第二語(yǔ)音訓(xùn)練集對(duì)所述一級(jí)語(yǔ)音識(shí)別模型進(jìn)行訓(xùn)練,得到二級(jí)語(yǔ)音識(shí)別模型。