一種多人語(yǔ)音分離方法及語(yǔ)音分離模型的訓(xùn)練方法
基本信息
申請(qǐng)?zhí)?/td> | CN202110917217.9 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113744753A | 公開(kāi)(公告)日 | 2021-12-03 |
申請(qǐng)公布號(hào) | CN113744753A | 申請(qǐng)公布日 | 2021-12-03 |
分類(lèi)號(hào) | G10L21/0272(2013.01)I;G10L21/028(2013.01)I;G10L25/30(2013.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類(lèi) | 樂(lè)器;聲學(xué); |
發(fā)明人 | 姜彥吉;邱友利;張勝;彭博;鄭四發(fā) | 申請(qǐng)(專(zhuān)利權(quán))人 | 華研慧聲(蘇州)電子科技有限公司 |
代理機(jī)構(gòu) | 蘇州創(chuàng)元專(zhuān)利商標(biāo)事務(wù)所有限公司 | 代理人 | 吳芳 |
地址 | 215000江蘇省蘇州市相城區(qū)高鐵新城太陽(yáng)路2266號(hào)5幢 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種多人語(yǔ)音分離方法及語(yǔ)音分離模型的訓(xùn)練方法,分離方法包括以下步驟:將混合語(yǔ)音數(shù)據(jù)輸入編碼器處理以輸出三維的特征張量;對(duì)特征張量進(jìn)行組歸一化處理、卷積操作和分段處理,將其結(jié)果輸入到自注意力塊中處理,以對(duì)其進(jìn)行分離函數(shù)映射,再經(jīng)過(guò)第一激活函數(shù)處理、卷積操作后進(jìn)行重疊操作,對(duì)其結(jié)果進(jìn)行卷積操作后分別經(jīng)過(guò)第二激活函數(shù)和第三激活函數(shù)的處理,以得到兩個(gè)特征張量,作乘積運(yùn)算后進(jìn)行卷積和第四激活函數(shù)處理,并與編碼器的輸出進(jìn)行乘積操作,以分離出不同說(shuō)話人的特征數(shù)據(jù)。本發(fā)明提供的多人語(yǔ)音分離方法及語(yǔ)音分離模型的訓(xùn)練方法不依賴時(shí)序關(guān)系,能夠很容易地進(jìn)行并行計(jì)算,提升模型的訓(xùn)練效率。 |
