一種對(duì)話場(chǎng)景語(yǔ)音情緒識(shí)別方法、裝置及計(jì)算設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN202010984306.0 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN114203202A | 公開(kāi)(公告)日 | 2022-03-18 |
申請(qǐng)公布號(hào) | CN114203202A | 申請(qǐng)公布日 | 2022-03-18 |
分類號(hào) | G10L25/63(2013.01)I;G10L25/30(2013.01)I | 分類 | 樂(lè)器;聲學(xué); |
發(fā)明人 | 孟慶林;吳海英;蔣寧;王洪斌;趙立軍 | 申請(qǐng)(專利權(quán))人 | 北京有限元科技有限公司 |
代理機(jī)構(gòu) | 北京萬(wàn)思博知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 范曉斌 |
地址 | 100080北京市海淀區(qū)王莊路1號(hào)B座23層27-整層2702 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開(kāi)了一種對(duì)話場(chǎng)景語(yǔ)音情緒識(shí)別方法、裝置及計(jì)算設(shè)備。所述方法包括:提取訓(xùn)練樣本的MFCC特征、一階差分特征和二階差分特征;讀取待訓(xùn)練特征文件,形成數(shù)據(jù)?標(biāo)簽的特征數(shù)據(jù)組合;將特征數(shù)據(jù)組合饋入改進(jìn)的AlexNet網(wǎng)絡(luò)及雙向BiGRU網(wǎng)絡(luò),并通過(guò)CTC進(jìn)行特征序列對(duì)齊,將CTC的輸出送入Softmax分類器,再根據(jù)交叉熵?fù)p失進(jìn)行反向傳播訓(xùn)練,得到識(shí)別模型;使用所述模型對(duì)客服與客戶聲道錄音進(jìn)行情緒分類。所述裝置包括訓(xùn)練特征提取模塊、數(shù)據(jù)標(biāo)簽?zāi)K、訓(xùn)練模塊和識(shí)別模塊。所述計(jì)算設(shè)備包括存儲(chǔ)器、處理器和存儲(chǔ)在存儲(chǔ)器內(nèi)并能由處理器運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)本申請(qǐng)所述的方法。 |
