一種語音信號特征融合的方法

基本信息

申請?zhí)?/td> CN201910556520.3 申請日 -
公開(公告)號 CN110322900A 公開(公告)日 2019-10-11
申請公布號 CN110322900A 申請公布日 2019-10-11
分類號 G10L25/63;G10L25/30;G10L25/03 分類 樂器;聲學;
發(fā)明人 左靖東;況鵬;范振;詹佳麗;黎寧 申請(專利權(quán))人 深圳市壹鴿科技有限公司
代理機構(gòu) 深圳叁眾知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 深圳市壹鴿科技有限公司
地址 518000 廣東省深圳市南山區(qū)粵海街道高新區(qū)社區(qū)高新南七道011號高新工業(yè)村T3棟3AA
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種新型的語音信號特征融合的方法,包括如下步驟:步驟1、模型框架搭建;步驟2、神經(jīng)網(wǎng)絡(luò)設(shè)計;步驟3、音頻特征表示和提取。本發(fā)明把CNN變體和LSTM變體并行融合成一種新的混合神經(jīng)網(wǎng)絡(luò),并結(jié)合Attention機制提取出對最終情感影響最大的信號特征,最終得到能更準確且快速分類情感的音頻情感向量,泛化能力強,結(jié)構(gòu)清晰,易于與其他模塊集成與分離,而且克服了傳統(tǒng)的語音信號特征不能有效融合的問題。