人聲分離提取方法方法、裝置、計算機設(shè)備及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202010792766.3 | 申請日 | - |
公開(公告)號 | CN111933172A | 公開(公告)日 | 2020-11-13 |
申請公布號 | CN111933172A | 申請公布日 | 2020-11-13 |
分類號 | G10L21/0272(2013.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 劉嗣平;柯登峰;張思萱 | 申請(專利權(quán))人 | 廣州九四智能科技有限公司 |
代理機構(gòu) | 深圳科灣知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 廣州九四智能科技有限公司 |
地址 | 510665廣東省廣州市天河區(qū)車陂路113號1405室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請實施例屬于語音識別技術(shù)領(lǐng)域,涉及人聲分離提取方法,包括一種人聲分離提取方法,包括將帶有環(huán)境噪聲的錄音轉(zhuǎn)化為原始幅度譜;將所述原始幅度譜輸入到預(yù)先訓(xùn)練的抗噪神經(jīng)網(wǎng)絡(luò),以確定與所述原始幅度譜相應(yīng)的p?PSM值,所述p?PSM值大于等于0;將所述原始幅度頻譜與對應(yīng)的p?PSM點乘,以獲取去噪幅度譜;將所述去噪幅度譜輸入到預(yù)先訓(xùn)練的諧波恢復(fù)神經(jīng)網(wǎng)絡(luò),以恢復(fù)所述去噪幅度頻譜,并獲取所述去噪幅度頻譜對應(yīng)的純凈幅度頻譜;將所述純凈幅度頻譜轉(zhuǎn)換為語音。本申請還提供一種人聲分離提取裝置、計算機設(shè)備及存儲介質(zhì)。本申請能夠避除噪聲規(guī)避過程中語音的損失,人聲提取更為準(zhǔn)確。?? |
