音頻數(shù)據(jù)增強方法、裝置、電子設(shè)備及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202210666591.0 申請日 -
公開(公告)號 CN114758665A 公開(公告)日 2022-07-15
申請公布號 CN114758665A 申請公布日 2022-07-15
分類號 G10L21/02(2013.01)I;G10L25/84(2013.01)I;G10L15/06(2013.01)I 分類 樂器;聲學;
發(fā)明人 鄭鑫江;凌明;楊作興;艾國 申請(專利權(quán))人 深圳比特微電子科技有限公司
代理機構(gòu) 北京德琦知識產(chǎn)權(quán)代理有限公司 代理人 -
地址 518000廣東省深圳市南山區(qū)高新南六道航盛科技大廈801
法律狀態(tài) -

摘要

摘要 本公開涉及一種音頻數(shù)據(jù)增強方法、裝置、電子設(shè)備及存儲介質(zhì),包括:確定音頻識別任務(wù),其中,音頻識別任務(wù)為關(guān)鍵詞檢測任務(wù)和/或者聲音事件檢測任務(wù);接收關(guān)聯(lián)于音頻識別任務(wù)的音頻數(shù)據(jù);根據(jù)音頻識別任務(wù),對音頻數(shù)據(jù)進行拆分重組,獲得針對音頻識別任務(wù)的增強樣本數(shù)據(jù);根據(jù)增強樣本數(shù)據(jù)和音頻識別任務(wù),得到針對音頻識別任務(wù)的音頻訓(xùn)練樣本。本公開對音頻數(shù)據(jù)進行拆分重組,所得到的音頻訓(xùn)練樣本具有針對關(guān)鍵詞檢測任務(wù)的更加突出的關(guān)鍵詞特征或者針對聲音事件檢測任務(wù)的更加突出的聲音特征,能夠提升關(guān)鍵詞檢測任務(wù)的語音識別的準確性并縮短聲音事件檢測任務(wù)的檢測響應(yīng)時長,可改善關(guān)鍵詞檢測任務(wù)和/或聲音事件檢測任務(wù)的用戶體驗。