一種基于集成學習的混合模型語音情感識別方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201911225002.X 申請日 -
公開(公告)號 CN110910902A 公開(公告)日 2020-03-24
申請公布號 CN110910902A 申請公布日 2020-03-24
分類號 G10L25/63;G10L25/78;G10L25/27 分類 樂器;聲學;
發(fā)明人 伍林;尹朝陽;李昊奇 申請(專利權)人 杭州哲信信息技術有限公司
代理機構 北京君泊知識產(chǎn)權代理有限公司 代理人 杭州哲信信息技術有限公司
地址 310020 浙江省杭州市江干區(qū)新塘路58號廣新商務大廈626室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于集成學習的混合模型語音情感識別方法及系統(tǒng),具體包括:構建情感識別語音數(shù)據(jù)集;對語音信號進行預處理;從預處理過后的語音信號中提取幀級別具有時序信息的語音信號特征;利用提取的語音信號特征分別采用多種算法進行建模,獲得多種模型;利用生成的模型對語音信號進行預測,將預測概率值作為輸入數(shù)據(jù)加入嶺回歸模型繼續(xù)訓練,構建混合模型;根據(jù)混合模型的輸出結果判斷語音信號的情感類別。本發(fā)明的有益效果為:通過利用多個集成模型構建混合模型,其魯棒性更強,算法識別精度更高;同時,將多個集成模型的預測結果利用嶺回歸模型重新訓練,可以更好的削弱不同情感間的相互影響,提高語音情感識別的效果。