一種基于偽說話人聚類的語音情感特征規(guī)整化方法

基本信息

申請(qǐng)?zhí)?/td> CN201310534319.8 申請(qǐng)日 -
公開(公告)號(hào) CN103531198A 公開(公告)日 2014-01-22
申請(qǐng)公布號(hào) CN103531198A 申請(qǐng)公布日 2014-01-22
分類號(hào) G10L15/02(2006.01)I;G10L25/63(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 黃程韋;趙力;魏昕;王浩;查誠(chéng);余華 申請(qǐng)(專利權(quán))人 南京宇音力新電子科技有限公司
代理機(jī)構(gòu) 江蘇永衡昭輝律師事務(wù)所 代理人 東南大學(xué);南京宇音力新電子科技有限公司;南京博克興電子科技有限公司
地址 210096 江蘇省南京市四牌樓2號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于偽說話人聚類的語音情感特征規(guī)整化方法,適合應(yīng)用于非特定說話人情感識(shí)別。本發(fā)明首先提取出能夠反映說話人信息的特征空間;接著在此特征空間內(nèi)進(jìn)行模糊聚類,自動(dòng)獲得情感語料中的說話人的身份信息,據(jù)此信息進(jìn)行“偽說話人”分組,每一條樣本按照其相似程度劃分到不同的偽說話人分組中;而后根據(jù)每條樣本的偽說話人組別信息,進(jìn)行情感特征的規(guī)整化;最終在規(guī)整化后的數(shù)據(jù)中加入相應(yīng)組別的模糊隸屬度信息。通過上述處理過程,使得情感特征空間中的樣本分布更加清晰有效,降低了大量說話人帶來的特征差異,增強(qiáng)了說話人魯棒性。