基于生成對(duì)抗網(wǎng)絡(luò)的高解析度音頻編解碼方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202210463201.X | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN114582361B | 公開(kāi)(公告)日 | 2022-07-08 |
申請(qǐng)公布號(hào) | CN114582361B | 申請(qǐng)公布日 | 2022-07-08 |
分類號(hào) | G10L19/26(2013.01)I;G10L19/24(2013.01)I;G10L19/032(2013.01)I;CN 111768793 A,2020.10.13;CN 103971693 A,2014.08.06;CN 101140759 A,2008.03.12;CN 112309408 A,2021.02.02;CN 107945811 A,2018.04.20;CN 112767954 A,2021.05.07;CN 111429926 A,2020.07.17;AU 2014283196 A1,2016.02.11;US 2021065723 A1,2021.03.04;US 2021166705 A1,2021.06.03 姜林.基于非線性映射模型的音頻帶寬擴(kuò)展編碼研究.《中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 信息科技輯》.中國(guó)學(xué)術(shù)期刊(光盤版)電子雜志社,2020,(第1期),全文.;郭慶巍.高保真低速率音頻編碼關(guān)鍵技術(shù)研究.《中國(guó)優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 信息科技輯》.2009,(第1期),全文.;Yang Xiang,et al..A Parallel-Data-Free Speech Enhancement Method Using Multi-Objective Learning Cycle-Consistent Generative Adversarial Network.《 IEEE/ACM Transactions on Audio, Speech, and Language Processing》.IEEE,2020,第28卷全文. | 分類 | 樂(lè)器;聲學(xué); |
發(fā)明人 | 李強(qiáng);朱勇;王堯;葉東翔 | 申請(qǐng)(專利權(quán))人 | 北京百瑞互聯(lián)技術(shù)股份有限公司 |
代理機(jī)構(gòu) | 北京國(guó)科程知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | - |
地址 | 100085北京市海淀區(qū)上地三街9號(hào)A座9層A1009 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開(kāi)了一種基于生成對(duì)抗網(wǎng)絡(luò)的高解析度音頻編解碼方法及系統(tǒng),屬于音頻編解碼技術(shù)領(lǐng)域,該方法包括:通過(guò)正交鏡像分析濾波器對(duì)編碼音頻進(jìn)行濾波,得到低頻帶音頻數(shù)據(jù)和高頻帶音頻數(shù)據(jù);對(duì)低頻帶音頻數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)LC3編碼,得到低頻帶碼流,獲取低頻譜包絡(luò);根據(jù)低頻譜包絡(luò)和高頻帶音頻數(shù)據(jù)對(duì)應(yīng)的頻域譜系數(shù),得到高頻帶碼流;音頻接收端對(duì)低頻帶碼流進(jìn)行標(biāo)準(zhǔn)LC3解碼流程,獲取低頻譜系數(shù),并得到解碼后的低頻帶數(shù)據(jù);利用預(yù)訓(xùn)練的生成網(wǎng)絡(luò),對(duì)高頻帶碼流進(jìn)行處理,得到解碼后的高頻帶數(shù)據(jù);通過(guò)正交鏡像合成濾波器對(duì)低頻帶數(shù)據(jù)和高頻帶數(shù)據(jù)進(jìn)行合成,得到解碼結(jié)果。本申請(qǐng)實(shí)現(xiàn)以兩倍的標(biāo)準(zhǔn)采樣率實(shí)現(xiàn)高解析度音頻編解碼。 |
