一種對(duì)話場(chǎng)景語(yǔ)音情緒識(shí)別方法、裝置及計(jì)算設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202010984306.0 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN114203202A 公開(kāi)(公告)日 2022-03-18
申請(qǐng)公布號(hào) CN114203202A 申請(qǐng)公布日 2022-03-18
分類號(hào) G10L25/63(2013.01)I;G10L25/30(2013.01)I 分類 樂(lè)器;聲學(xué);
發(fā)明人 孟慶林;吳海英;蔣寧;王洪斌;趙立軍 申請(qǐng)(專利權(quán))人 北京有限元科技有限公司
代理機(jī)構(gòu) 北京萬(wàn)思博知識(shí)產(chǎn)權(quán)代理有限公司 代理人 范曉斌
地址 100080北京市海淀區(qū)王莊路1號(hào)B座23層27-整層2702
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開(kāi)了一種對(duì)話場(chǎng)景語(yǔ)音情緒識(shí)別方法、裝置及計(jì)算設(shè)備。所述方法包括:提取訓(xùn)練樣本的MFCC特征、一階差分特征和二階差分特征;讀取待訓(xùn)練特征文件,形成數(shù)據(jù)?標(biāo)簽的特征數(shù)據(jù)組合;將特征數(shù)據(jù)組合饋入改進(jìn)的AlexNet網(wǎng)絡(luò)及雙向BiGRU網(wǎng)絡(luò),并通過(guò)CTC進(jìn)行特征序列對(duì)齊,將CTC的輸出送入Softmax分類器,再根據(jù)交叉熵?fù)p失進(jìn)行反向傳播訓(xùn)練,得到識(shí)別模型;使用所述模型對(duì)客服與客戶聲道錄音進(jìn)行情緒分類。所述裝置包括訓(xùn)練特征提取模塊、數(shù)據(jù)標(biāo)簽?zāi)K、訓(xùn)練模塊和識(shí)別模塊。所述計(jì)算設(shè)備包括存儲(chǔ)器、處理器和存儲(chǔ)在存儲(chǔ)器內(nèi)并能由處理器運(yùn)行的計(jì)算機(jī)程序,所述處理器執(zhí)行所述計(jì)算機(jī)程序時(shí)實(shí)現(xiàn)本申請(qǐng)所述的方法。