一種語音信號(hào)特征融合的方法

基本信息

申請(qǐng)?zhí)?/td> CN201910556520.3 申請(qǐng)日 -
公開(公告)號(hào) CN110322900A 公開(公告)日 2019-10-11
申請(qǐng)公布號(hào) CN110322900A 申請(qǐng)公布日 2019-10-11
分類號(hào) G10L25/63;G10L25/30;G10L25/03 分類 樂器;聲學(xué);
發(fā)明人 左靖東;況鵬;范振;詹佳麗;黎寧 申請(qǐng)(專利權(quán))人 深圳市壹鴿科技有限公司
代理機(jī)構(gòu) 深圳叁眾知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 深圳市壹鴿科技有限公司
地址 518000 廣東省深圳市南山區(qū)粵海街道高新區(qū)社區(qū)高新南七道011號(hào)高新工業(yè)村T3棟3AA
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種新型的語音信號(hào)特征融合的方法,包括如下步驟:步驟1、模型框架搭建;步驟2、神經(jīng)網(wǎng)絡(luò)設(shè)計(jì);步驟3、音頻特征表示和提取。本發(fā)明把CNN變體和LSTM變體并行融合成一種新的混合神經(jīng)網(wǎng)絡(luò),并結(jié)合Attention機(jī)制提取出對(duì)最終情感影響最大的信號(hào)特征,最終得到能更準(zhǔn)確且快速分類情感的音頻情感向量,泛化能力強(qiáng),結(jié)構(gòu)清晰,易于與其他模塊集成與分離,而且克服了傳統(tǒng)的語音信號(hào)特征不能有效融合的問題。