音頻數(shù)據(jù)增強方法、裝置、電子設備及存儲介質

基本信息

申請?zhí)?/td> CN202210666591.0 申請日 -
公開(公告)號 CN114758665A 公開(公告)日 2022-07-15
申請公布號 CN114758665A 申請公布日 2022-07-15
分類號 G10L21/02(2013.01)I;G10L25/84(2013.01)I;G10L15/06(2013.01)I 分類 樂器;聲學;
發(fā)明人 鄭鑫江;凌明;楊作興;艾國 申請(專利權)人 深圳比特微電子科技有限公司
代理機構 北京德琦知識產(chǎn)權代理有限公司 代理人 -
地址 518000廣東省深圳市南山區(qū)高新南六道航盛科技大廈801
法律狀態(tài) -

摘要

摘要 本公開涉及一種音頻數(shù)據(jù)增強方法、裝置、電子設備及存儲介質,包括:確定音頻識別任務,其中,音頻識別任務為關鍵詞檢測任務和/或者聲音事件檢測任務;接收關聯(lián)于音頻識別任務的音頻數(shù)據(jù);根據(jù)音頻識別任務,對音頻數(shù)據(jù)進行拆分重組,獲得針對音頻識別任務的增強樣本數(shù)據(jù);根據(jù)增強樣本數(shù)據(jù)和音頻識別任務,得到針對音頻識別任務的音頻訓練樣本。本公開對音頻數(shù)據(jù)進行拆分重組,所得到的音頻訓練樣本具有針對關鍵詞檢測任務的更加突出的關鍵詞特征或者針對聲音事件檢測任務的更加突出的聲音特征,能夠提升關鍵詞檢測任務的語音識別的準確性并縮短聲音事件檢測任務的檢測響應時長,可改善關鍵詞檢測任務和/或聲音事件檢測任務的用戶體驗。