用于自語音中識別情感的方法與裝置

基本信息

申請?zhí)?/td> CN201711378503.2 申請日 -
公開(公告)號 CN108091323A 公開(公告)日 2018-05-29
申請公布號 CN108091323A 申請公布日 2018-05-29
分類號 G10L15/02;G10L15/04;G10L15/06;G10L25/24;G10L25/63 分類 樂器;聲學(xué);
發(fā)明人 C·C·多斯曼;B·N·利亞納蓋;T·J·M·厄斯特勒姆 申請(專利權(quán))人 想象科技(北京)有限公司
代理機(jī)構(gòu) 北京律盟知識產(chǎn)權(quán)代理有限責(zé)任公司 代理人 想象科技(北京)有限公司
地址 100025 北京市朝陽區(qū)建國路89號院4號樓805號
法律狀態(tài) -

摘要

摘要 本申請是關(guān)于自語音中識別情感的方法與裝置。根據(jù)本申請一實(shí)施例的用于自語音中識別情感的方法可包括:接收音頻信號、對所接收的音頻信號進(jìn)行數(shù)據(jù)清理、將所清理的音頻信號分割成至少一段、對該至少一段執(zhí)行特征提取以自該至少一段中提取若干梅爾頻率倒譜系數(shù)和若干巴克頻率倒譜系數(shù)、執(zhí)行特征填充以基于長度門限將該若干梅爾頻率倒譜系數(shù)和若干巴克頻率倒譜系數(shù)填充至特征矩陣,以及對該特征矩陣執(zhí)行機(jī)器學(xué)習(xí)推斷以識別在該音頻信號中所指示的情感。本申請實(shí)施例可適用于幾乎任何尺寸的音頻信號,且能實(shí)時識別整個語音的情感。