一種提高語音命令詞識(shí)別性能的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法

基本信息

申請(qǐng)?zhí)?/td> CN202011042026.4 申請(qǐng)日 -
公開(公告)號(hào) CN112233655A 公開(公告)日 2021-01-15
申請(qǐng)公布號(hào) CN112233655A 申請(qǐng)公布日 2021-01-15
分類號(hào) G10L15/02(2006.01)I 分類 樂器;聲學(xué);
發(fā)明人 宋昱;蔡洪斌;黃樂凱;葉劍豪;何昕 申請(qǐng)(專利權(quán))人 上海聲瀚信息科技有限公司
代理機(jī)構(gòu) 北京化育知識(shí)產(chǎn)權(quán)代理有限公司 代理人 上海聲瀚信息科技有限公司
地址 200120上海市浦東新區(qū)中國(上海)自由貿(mào)易試驗(yàn)區(qū)納賢路800號(hào)1幢A座608室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種提高語音命令詞識(shí)別性能的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法,本訓(xùn)練方法的目標(biāo)神經(jīng)網(wǎng)絡(luò)采用的輸入為從原始音頻中提取的N維特征值,輸出為M維音素標(biāo)簽,訓(xùn)練采用CTC Loss作為最終優(yōu)化目標(biāo);本發(fā)明提供的一種提高語音命令詞識(shí)別性能的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法,訓(xùn)練過程中,定期根據(jù)中間神經(jīng)網(wǎng)絡(luò)模型在驗(yàn)證集上測(cè)試結(jié)果,動(dòng)態(tài)調(diào)整不同命令詞對(duì)權(quán)重的貢獻(xiàn),從而使命令詞識(shí)別結(jié)果的相對(duì)均衡;通過在命令詞識(shí)別標(biāo)簽中加入字邊界標(biāo)簽,進(jìn)一步提高命令詞的識(shí)別率,降低誤觸的發(fā)生。??