基于深度學(xué)習(xí)的多模態(tài)融合的歌曲情感識(shí)別方法
基本信息
申請(qǐng)?zhí)?/td> | CN201610625990.7 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN106228977A | 公開(kāi)(公告)日 | 2016-12-14 |
申請(qǐng)公布號(hào) | CN106228977A | 申請(qǐng)公布日 | 2016-12-14 |
分類號(hào) | G10L15/02(2006.01)I;G10L15/06(2013.01)I;G10L15/18(2013.01)I;G10L15/26(2006.01)I | 分類 | 樂(lè)器;聲學(xué); |
發(fā)明人 | 孫曉;陳煒亮;任福繼 | 申請(qǐng)(專利權(quán))人 | 青島類認(rèn)知人工智能有限公司 |
代理機(jī)構(gòu) | 安徽省合肥新安專利代理有限責(zé)任公司 | 代理人 | 陸麗莉;何梅生 |
地址 | 266000 山東省青島市市南區(qū)寧夏路288號(hào)市南軟件園11號(hào)樓A座5層502室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于深度學(xué)習(xí)的多模態(tài)耦合的歌曲情感識(shí)別方法,其特征是按如下步驟進(jìn)行:1獲取歌曲歌詞文本數(shù)據(jù)和音頻語(yǔ)音數(shù)據(jù);2對(duì)歌詞文本內(nèi)容進(jìn)行文本特征提取,獲得歌詞文本信息特征;3提取歌曲語(yǔ)音數(shù)據(jù)的第一語(yǔ)音特征和第二語(yǔ)音特征并進(jìn)行第一次融合,獲得歌曲語(yǔ)音信息特征;4對(duì)歌詞文本信息特征和歌曲語(yǔ)音信息特征進(jìn)行第二次融合,獲得歌曲的綜合信息特征;5利用深度分類器對(duì)綜合信息特征進(jìn)行訓(xùn)練,獲得歌曲情感識(shí)別模型,以歌曲情感識(shí)別模型實(shí)現(xiàn)對(duì)歌曲的多模態(tài)融合的情感識(shí)別。本發(fā)明能全面結(jié)合歌曲的歌詞文本信息和歌曲音頻信息兩個(gè)方面的數(shù)據(jù)信息,從而提高人機(jī)交互中的對(duì)歌曲情感狀態(tài)判斷的準(zhǔn)確度。 |
