語音數(shù)據(jù)處理方法、裝置、設(shè)備及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202110441718.4 | 申請日 | - |
公開(公告)號 | CN113345422A | 公開(公告)日 | 2021-09-03 |
申請公布號 | CN113345422A | 申請公布日 | 2021-09-03 |
分類號 | G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/26(2006.01)I | 分類 | 樂器;聲學; |
發(fā)明人 | 王亞東 | 申請(專利權(quán))人 | 北京巔峰科技有限公司 |
代理機構(gòu) | 北京國昊天誠知識產(chǎn)權(quán)代理有限公司 | 代理人 | 姜鳳巖;朱文杰 |
地址 | 100085北京市海淀區(qū)上地信息產(chǎn)業(yè)基地三街1號樓四層C段402 | ||
法律狀態(tài) | - |
摘要
摘要 | 本說明書一個或多個實施例提供了一種語音數(shù)據(jù)處理方法、裝置、設(shè)備及存儲介質(zhì),其中方法包括:獲取待處理的語音數(shù)據(jù);在各預(yù)設(shè)的語音數(shù)據(jù)處理操作中隨機選取目標語音處理操作;所述各預(yù)設(shè)的語音數(shù)據(jù)處理操作包括:時域掩碼、頻域掩碼、音高變換、音量變換、音頻加噪;獲取所述目標語音處理操作的語音處理參數(shù)所對應(yīng)的取值范圍,在所述取值范圍內(nèi),隨機選取所述目標語音處理操作的語音處理參數(shù)的參數(shù)值;基于所述參數(shù)值,利用所述目標語音處理操作對所述待處理的語音數(shù)據(jù)進行處理。通過本實施例,能夠解決目前擴充語音識別模型的訓(xùn)練樣本的數(shù)據(jù)量時,擴充過程復(fù)雜、擴充成本高的問題。 |
