人聲分離提取方法方法、裝置、計算機設(shè)備及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202010792766.3 申請日 -
公開(公告)號 CN111933172A 公開(公告)日 2020-11-13
申請公布號 CN111933172A 申請公布日 2020-11-13
分類號 G10L21/0272(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 劉嗣平;柯登峰;張思萱 申請(專利權(quán))人 廣州九四智能科技有限公司
代理機構(gòu) 深圳科灣知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 廣州九四智能科技有限公司
地址 510665廣東省廣州市天河區(qū)車陂路113號1405室
法律狀態(tài) -

摘要

摘要 本申請實施例屬于語音識別技術(shù)領(lǐng)域,涉及人聲分離提取方法,包括一種人聲分離提取方法,包括將帶有環(huán)境噪聲的錄音轉(zhuǎn)化為原始幅度譜;將所述原始幅度譜輸入到預(yù)先訓(xùn)練的抗噪神經(jīng)網(wǎng)絡(luò),以確定與所述原始幅度譜相應(yīng)的p?PSM值,所述p?PSM值大于等于0;將所述原始幅度頻譜與對應(yīng)的p?PSM點乘,以獲取去噪幅度譜;將所述去噪幅度譜輸入到預(yù)先訓(xùn)練的諧波恢復(fù)神經(jīng)網(wǎng)絡(luò),以恢復(fù)所述去噪幅度頻譜,并獲取所述去噪幅度頻譜對應(yīng)的純凈幅度頻譜;將所述純凈幅度頻譜轉(zhuǎn)換為語音。本申請還提供一種人聲分離提取裝置、計算機設(shè)備及存儲介質(zhì)。本申請能夠避除噪聲規(guī)避過程中語音的損失,人聲提取更為準(zhǔn)確。??