一種語音信號特征融合的方法
基本信息
申請?zhí)?/td> | CN201910556520.3 | 申請日 | - |
公開(公告)號 | CN110322900A | 公開(公告)日 | 2019-10-11 |
申請公布號 | CN110322900A | 申請公布日 | 2019-10-11 |
分類號 | G10L25/63;G10L25/30;G10L25/03 | 分類 | 樂器;聲學; |
發(fā)明人 | 左靖東;況鵬;范振;詹佳麗;黎寧 | 申請(專利權(quán))人 | 深圳市壹鴿科技有限公司 |
代理機構(gòu) | 深圳叁眾知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 深圳市壹鴿科技有限公司 |
地址 | 518000 廣東省深圳市南山區(qū)粵海街道高新區(qū)社區(qū)高新南七道011號高新工業(yè)村T3棟3AA | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種新型的語音信號特征融合的方法,包括如下步驟:步驟1、模型框架搭建;步驟2、神經(jīng)網(wǎng)絡(luò)設(shè)計;步驟3、音頻特征表示和提取。本發(fā)明把CNN變體和LSTM變體并行融合成一種新的混合神經(jīng)網(wǎng)絡(luò),并結(jié)合Attention機制提取出對最終情感影響最大的信號特征,最終得到能更準確且快速分類情感的音頻情感向量,泛化能力強,結(jié)構(gòu)清晰,易于與其他模塊集成與分離,而且克服了傳統(tǒng)的語音信號特征不能有效融合的問題。 |
