多特征融合識(shí)別嬰兒哭聲類別的方法、裝置及設(shè)備
基本信息
申請?zhí)?/td> | CN202110218120.9 | 申請日 | - |
公開(公告)號(hào) | CN113035241A | 公開(公告)日 | 2021-06-25 |
申請公布號(hào) | CN113035241A | 申請公布日 | 2021-06-25 |
分類號(hào) | G10L25/63;G10L25/03;G10L25/18;G10L25/24;G10L25/30;G10L25/45;G10L25/57;G10L17/02;G06K9/62;G06N3/04;G06N3/08 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 陳輝;張智;謝鵬;雷奇文;艾偉;胡國湖 | 申請(專利權(quán))人 | 武漢星巡智能科技有限公司 |
代理機(jī)構(gòu) | 成都恪睿信專利代理事務(wù)所(普通合伙) | 代理人 | 陳興強(qiáng) |
地址 | 430000 湖北省武漢市洪山區(qū)洪山街馬湖村武漢創(chuàng)意天地三、四期4號(hào)樓9層4號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明屬于語音識(shí)別技術(shù)領(lǐng)域,解決了通過語音識(shí)別判斷嬰兒哭聲,存在準(zhǔn)確性低的技術(shù)問題,提供了一種多特征融合識(shí)別嬰兒哭聲類別的方法、裝置及設(shè)備。該方法包括:獲取嬰兒啼哭時(shí)的音頻特征、姿態(tài)動(dòng)作的動(dòng)作特征值和聲帶振動(dòng)的振動(dòng)頻譜;將動(dòng)作特征值轉(zhuǎn)化為數(shù)據(jù)庫中的標(biāo)準(zhǔn)特征值;基于標(biāo)準(zhǔn)特征值,對音頻特征和振動(dòng)頻譜進(jìn)行特征融合;將融合后的融合特征輸入預(yù)置的神經(jīng)網(wǎng)絡(luò),根據(jù)神經(jīng)網(wǎng)絡(luò)輸出的編碼特征向量得到嬰兒的哭聲類別;其中,標(biāo)準(zhǔn)特征值為對應(yīng)的姿態(tài)動(dòng)作所表征的各哭聲類別的概率值。本發(fā)明還包括用于執(zhí)行上述方法的裝置及設(shè)備。本發(fā)明利用姿態(tài)特征來強(qiáng)化嬰兒的需求,可以減低錯(cuò)誤判斷,提高哭聲檢測準(zhǔn)確性。 |
