一種基于偽說話人聚類的語音情感特征規(guī)整化方法

基本信息

申請?zhí)?/td> CN201310534319.8 申請日 -
公開(公告)號 CN103531198B 公開(公告)日 2016-03-23
申請公布號 CN103531198B 申請公布日 2016-03-23
分類號 G10L15/02(2006.01)I;G10L25/63(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 黃程韋;趙力;魏昕;王浩;查誠;余華 申請(專利權(quán))人 南京領(lǐng)路鳥物聯(lián)網(wǎng)科技有限公司
代理機構(gòu) 江蘇永衡昭輝律師事務(wù)所 代理人 東南大學(xué);南京宇音力新電子科技有限公司;南京勵智心理大數(shù)據(jù)產(chǎn)業(yè)研究院有限公司;南京博克興電子科技有限公司
地址 210096 江蘇省南京市四牌樓2號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于偽說話人聚類的語音情感特征規(guī)整化方法,適合應(yīng)用于非特定說話人情感識別。本發(fā)明首先提取出能夠反映說話人信息的特征空間;接著在此特征空間內(nèi)進行模糊聚類,自動獲得情感語料中的說話人的身份信息,據(jù)此信息進行“偽說話人”分組,每一條樣本按照其相似程度劃分到不同的偽說話人分組中;而后根據(jù)每條樣本的偽說話人組別信息,進行情感特征的規(guī)整化;最終在規(guī)整化后的數(shù)據(jù)中加入相應(yīng)組別的模糊隸屬度信息。通過上述處理過程,使得情感特征空間中的樣本分布更加清晰有效,降低了大量說話人帶來的特征差異,增強了說話人魯棒性。