一種語音增強方法、電子設(shè)備、芯片系統(tǒng)及可讀存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202210080908.2 | 申請日 | - |
公開(公告)號 | CN114093380B | 公開(公告)日 | 2022-07-05 |
申請公布號 | CN114093380B | 申請公布日 | 2022-07-05 |
分類號 | G10L21/02(2013.01)I;G10L21/0232(2013.01)I;G10L25/30(2013.01)I;G10L25/87(2013.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I | 分類 | 樂器;聲學; |
發(fā)明人 | 玄建永;劉鎮(zhèn)億;高海寬;郭鑫濤 | 申請(專利權(quán))人 | 北京榮耀終端有限公司 |
代理機構(gòu) | 深圳中一聯(lián)合知識產(chǎn)權(quán)代理有限公司 | 代理人 | - |
地址 | 100095 北京市海淀區(qū)忍冬路5號院3號樓2-14層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請?zhí)峁┮环N語音增強方法、電子設(shè)備、芯片系統(tǒng)及可讀存儲介質(zhì),涉及音視頻處理技術(shù)領(lǐng)域;該方法包括:提取視頻流中的圖像幀的圖像特征;提取音頻流中的音頻幀的頻域特征,其中,所述音頻流和所述視頻流具有時間相關(guān)性;將所述圖像特征和所述頻域特征進行拼接,得到拼接特征;識別所述拼接特征在各頻點上存在語音的概率值;基于所述概率值和所述音頻幀,得到語音增強后的音頻流;通過該方法可以改善語音增強效果。 |
