音頻數(shù)據(jù)增強方法、裝置、電子設(shè)備及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202210666591.0 | 申請日 | - |
公開(公告)號 | CN114758665A | 公開(公告)日 | 2022-07-15 |
申請公布號 | CN114758665A | 申請公布日 | 2022-07-15 |
分類號 | G10L21/02(2013.01)I;G10L25/84(2013.01)I;G10L15/06(2013.01)I | 分類 | 樂器;聲學; |
發(fā)明人 | 鄭鑫江;凌明;楊作興;艾國 | 申請(專利權(quán))人 | 深圳比特微電子科技有限公司 |
代理機構(gòu) | 北京德琦知識產(chǎn)權(quán)代理有限公司 | 代理人 | - |
地址 | 518000廣東省深圳市南山區(qū)高新南六道航盛科技大廈801 | ||
法律狀態(tài) | - |
摘要
摘要 | 本公開涉及一種音頻數(shù)據(jù)增強方法、裝置、電子設(shè)備及存儲介質(zhì),包括:確定音頻識別任務(wù),其中,音頻識別任務(wù)為關(guān)鍵詞檢測任務(wù)和/或者聲音事件檢測任務(wù);接收關(guān)聯(lián)于音頻識別任務(wù)的音頻數(shù)據(jù);根據(jù)音頻識別任務(wù),對音頻數(shù)據(jù)進行拆分重組,獲得針對音頻識別任務(wù)的增強樣本數(shù)據(jù);根據(jù)增強樣本數(shù)據(jù)和音頻識別任務(wù),得到針對音頻識別任務(wù)的音頻訓(xùn)練樣本。本公開對音頻數(shù)據(jù)進行拆分重組,所得到的音頻訓(xùn)練樣本具有針對關(guān)鍵詞檢測任務(wù)的更加突出的關(guān)鍵詞特征或者針對聲音事件檢測任務(wù)的更加突出的聲音特征,能夠提升關(guān)鍵詞檢測任務(wù)的語音識別的準確性并縮短聲音事件檢測任務(wù)的檢測響應(yīng)時長,可改善關(guān)鍵詞檢測任務(wù)和/或聲音事件檢測任務(wù)的用戶體驗。 |
