一種基于深度學(xué)習(xí)的語(yǔ)音情緒識(shí)別方案
基本信息
申請(qǐng)?zhí)?/td> | CN202010089880.X | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN111292724A | 公開(kāi)(公告)日 | 2020-06-16 |
申請(qǐng)公布號(hào) | CN111292724A | 申請(qǐng)公布日 | 2020-06-16 |
分類(lèi)號(hào) | G10L15/06(2013.01)I | 分類(lèi) | - |
發(fā)明人 | 封吉寧 | 申請(qǐng)(專(zhuān)利權(quán))人 | 上海凱岸信息科技有限公司 |
代理機(jī)構(gòu) | 上海海貝律師事務(wù)所 | 代理人 | 上海凱岸信息科技有限公司 |
地址 | 201808上海市嘉定區(qū)嘉羅公路1661弄12號(hào)101室-16 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于深度學(xué)習(xí)的語(yǔ)音情緒識(shí)別方案,包括如下步驟:步驟一,將訓(xùn)練用語(yǔ)音音頻文件進(jìn)行傅里葉變換轉(zhuǎn)換到頻域,然后再利用梅爾頻率刻度的濾波器組對(duì)對(duì)應(yīng)頻域信號(hào)進(jìn)行處理得到,就可以得到梅爾譜圖,步驟二,語(yǔ)音情緒分類(lèi)模型進(jìn)行建立:將步驟一中的梅爾譜圖經(jīng)過(guò)CNN和LSTM的計(jì)算后,自動(dòng)生成對(duì)于語(yǔ)音情緒分類(lèi)重要的組合特征變量。本發(fā)明,第一點(diǎn)是使用深度學(xué)習(xí)方法替代傳統(tǒng)機(jī)器學(xué)習(xí)方法,省去了耗時(shí)耗力的手工進(jìn)行特征工程的步驟,使得整個(gè)模型訓(xùn)練過(guò)程更加清晰簡(jiǎn)潔。?? |
