多模態(tài)情感識別方法、裝置、設(shè)備及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202010727888.4 申請日 -
公開(公告)號 CN111898670A 公開(公告)日 2020-11-06
申請公布號 CN111898670A 申請公布日 2020-11-06
分類號 G06K9/62(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 劉鵬飛;李坤;蒙美玲 申請(專利權(quán))人 深圳市聲??萍加邢薰?/a>
代理機(jī)構(gòu) 深圳市恒程創(chuàng)新知識產(chǎn)權(quán)代理有限公司 代理人 深圳市聲希科技有限公司
地址 518000廣東省深圳市新安街道興東社區(qū)留仙大道2號匯聚創(chuàng)新園2棟2710
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于情感識別技術(shù)領(lǐng)域,公開了一種多模態(tài)情感識別方法、裝置、設(shè)備及存儲介質(zhì)。該方法包括:獲取待識別語音音頻的語音特征和文本特征;對所述語音特征和所述文本特征進(jìn)行相關(guān)性對齊,獲得與所述文本特征對齊的目標(biāo)語音信息和與所述語音特征對齊的目標(biāo)文本信息;對所述目標(biāo)語音信息與所述目標(biāo)文本信息進(jìn)行融合,獲得目標(biāo)待識別信息;根據(jù)所述目標(biāo)待識別信息進(jìn)行情感識別,得到情感識別結(jié)果。通過上述方式,對語音特征和文本特征進(jìn)行了相關(guān)性對齊,得到更具識別性的雙向?qū)R特征,并對雙向?qū)R的特征信息進(jìn)行了融合,為情感識別提供了更具有區(qū)分性的待識別信息,提高情感識別結(jié)果的準(zhǔn)確性。??