一種基于偽說話人聚類的語音情感特征規(guī)整化方法

基本信息

申請?zhí)?/td> CN201310534319.8 申請日 -
公開(公告)號 CN103531198B 公開(公告)日 2016-03-23
申請公布號 CN103531198B 申請公布日 2016-03-23
分類號 G10L15/02(2006.01)I;G10L25/63(2013.01)I 分類 樂器;聲學;
發(fā)明人 黃程韋;趙力;魏昕;王浩;查誠;余華 申請(專利權)人 南京宇音力新電子科技有限公司
代理機構 江蘇永衡昭輝律師事務所 代理人 東南大學;南京宇音力新電子科技有限公司;南京勵智心理大數據產業(yè)研究院有限公司;南京博克興電子科技有限公司
地址 210096 江蘇省南京市四牌樓2號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于偽說話人聚類的語音情感特征規(guī)整化方法,適合應用于非特定說話人情感識別。本發(fā)明首先提取出能夠反映說話人信息的特征空間;接著在此特征空間內進行模糊聚類,自動獲得情感語料中的說話人的身份信息,據此信息進行“偽說話人”分組,每一條樣本按照其相似程度劃分到不同的偽說話人分組中;而后根據每條樣本的偽說話人組別信息,進行情感特征的規(guī)整化;最終在規(guī)整化后的數據中加入相應組別的模糊隸屬度信息。通過上述處理過程,使得情感特征空間中的樣本分布更加清晰有效,降低了大量說話人帶來的特征差異,增強了說話人魯棒性。