針對目標說話人提取的單通道語音分離方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202011057722.2 申請日 -
公開(公告)號 CN111899757A 公開(公告)日 2020-11-06
申請公布號 CN111899757A 申請公布日 2020-11-06
分類號 G10L21/0272(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 史慧宇;歐陽鵬 申請(專利權(quán))人 南京蘊智科技有限公司
代理機構(gòu) 北京索睿邦知識產(chǎn)權(quán)代理有限公司 代理人 李根
地址 211100江蘇省南京市江寧區(qū)麒麟科技創(chuàng)新園創(chuàng)研路266號人工智能產(chǎn)業(yè)園8號樓4樓
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了針對目標說話人提取的單通道語音分離方法,包括:獲取目標說話人混合語音樣本。根據(jù)初始化后的初始深度神經(jīng)網(wǎng)絡(luò)模型參數(shù),訓(xùn)練初始深度神經(jīng)網(wǎng)絡(luò)模型獲取第一深度神經(jīng)網(wǎng)絡(luò)模型。生成第二深度神經(jīng)網(wǎng)絡(luò)模型。初始化第二深度神經(jīng)網(wǎng)絡(luò)模型。獲取當前深度神經(jīng)網(wǎng)絡(luò)模型。根據(jù)估計掩蔽及目標說話人混合語音樣本的音頻獲取目標說話人語音樣本。本發(fā)明中的針對目標說話人提取的單通道語音分離方法比現(xiàn)有的目標說話人提取單通道語音分離方法能在提高分離準確度、說話可懂度的同時,縮小算法的網(wǎng)絡(luò)模型尺寸,減少計算內(nèi)存,增強算法落地實現(xiàn)的有效性。同時,本發(fā)明還提供了針對目標說話人提取的單通道語音分離系統(tǒng)。??