基于生成對抗網(wǎng)絡(luò)的頻帶擴(kuò)展方法、編解碼方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202210322549.7 申請日 -
公開(公告)號 CN114420140B 公開(公告)日 2022-06-21
申請公布號 CN114420140B 申請公布日 2022-06-21
分類號 G10L19/02;G10L19/16;G10L25/30;G06N3/04;G06N3/08 分類 樂器;聲學(xué);
發(fā)明人 李強(qiáng);朱勇;葉東翔;王堯 申請(專利權(quán))人 北京百瑞互聯(lián)技術(shù)股份有限公司
代理機(jī)構(gòu) 北京國科程知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 曹曉斐
地址 100085 北京市海淀區(qū)上地三街9號A座9層A1009
法律狀態(tài) -

摘要

摘要 本申請公開了一種基于生成對抗網(wǎng)絡(luò)的頻帶擴(kuò)展方法、編解碼方法及系統(tǒng),屬于音頻編解碼技術(shù)領(lǐng)域,該方法包括:在音頻編碼或解碼過程中,通過LC3音頻編碼器或解碼器對輸入的音頻數(shù)據(jù)進(jìn)行特征提取,確定其對應(yīng)的譜系數(shù);對譜系數(shù)進(jìn)行帶寬檢測,得到帶寬指示;若帶寬指示為窄帶寬,則通過預(yù)訓(xùn)練的生成神經(jīng)網(wǎng)絡(luò)對窄帶寬對應(yīng)的低頻譜系數(shù)進(jìn)行擴(kuò)展,得到高頻譜系數(shù);將低頻譜系數(shù)和高頻譜系數(shù)組合,得到寬帶譜系數(shù)。本申請在音頻編碼或解碼過程中,利用LC3編解碼器中已有的模塊獲取音頻數(shù)據(jù)的譜系數(shù),并通過神經(jīng)網(wǎng)絡(luò)生成最終的寬帶譜系數(shù),完成頻帶的擴(kuò)展。在編碼或解碼過程中完成頻帶擴(kuò)展,節(jié)省算力,降低功耗,適用低功耗藍(lán)牙,保證頻帶擴(kuò)展的準(zhǔn)確性。