一種提高語音命令詞識(shí)別性能的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法
基本信息
申請(qǐng)?zhí)?/td> | CN202011042026.4 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112233655A | 公開(公告)日 | 2021-01-15 |
申請(qǐng)公布號(hào) | CN112233655A | 申請(qǐng)公布日 | 2021-01-15 |
分類號(hào) | G10L15/02(2006.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 宋昱;蔡洪斌;黃樂凱;葉劍豪;何昕 | 申請(qǐng)(專利權(quán))人 | 上海聲瀚信息科技有限公司 |
代理機(jī)構(gòu) | 北京化育知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 上海聲瀚信息科技有限公司 |
地址 | 200120上海市浦東新區(qū)中國(上海)自由貿(mào)易試驗(yàn)區(qū)納賢路800號(hào)1幢A座608室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種提高語音命令詞識(shí)別性能的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法,本訓(xùn)練方法的目標(biāo)神經(jīng)網(wǎng)絡(luò)采用的輸入為從原始音頻中提取的N維特征值,輸出為M維音素標(biāo)簽,訓(xùn)練采用CTC Loss作為最終優(yōu)化目標(biāo);本發(fā)明提供的一種提高語音命令詞識(shí)別性能的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法,訓(xùn)練過程中,定期根據(jù)中間神經(jīng)網(wǎng)絡(luò)模型在驗(yàn)證集上測(cè)試結(jié)果,動(dòng)態(tài)調(diào)整不同命令詞對(duì)權(quán)重的貢獻(xiàn),從而使命令詞識(shí)別結(jié)果的相對(duì)均衡;通過在命令詞識(shí)別標(biāo)簽中加入字邊界標(biāo)簽,進(jìn)一步提高命令詞的識(shí)別率,降低誤觸的發(fā)生。?? |
