一種語音增強方法、電子設(shè)備、芯片系統(tǒng)及可讀存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202210080908.2 申請日 -
公開(公告)號 CN114093380B 公開(公告)日 2022-07-05
申請公布號 CN114093380B 申請公布日 2022-07-05
分類號 G10L21/02(2013.01)I;G10L21/0232(2013.01)I;G10L25/30(2013.01)I;G10L25/87(2013.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I 分類 樂器;聲學;
發(fā)明人 玄建永;劉鎮(zhèn)億;高海寬;郭鑫濤 申請(專利權(quán))人 北京榮耀終端有限公司
代理機構(gòu) 深圳中一聯(lián)合知識產(chǎn)權(quán)代理有限公司 代理人 -
地址 100095 北京市海淀區(qū)忍冬路5號院3號樓2-14層
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┮环N語音增強方法、電子設(shè)備、芯片系統(tǒng)及可讀存儲介質(zhì),涉及音視頻處理技術(shù)領(lǐng)域;該方法包括:提取視頻流中的圖像幀的圖像特征;提取音頻流中的音頻幀的頻域特征,其中,所述音頻流和所述視頻流具有時間相關(guān)性;將所述圖像特征和所述頻域特征進行拼接,得到拼接特征;識別所述拼接特征在各頻點上存在語音的概率值;基于所述概率值和所述音頻幀,得到語音增強后的音頻流;通過該方法可以改善語音增強效果。