基于深層神經(jīng)網(wǎng)絡(luò)的嬰兒啼哭聲識(shí)別方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201310347807.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN104347066B 公開(kāi)(公告)日 2019-11-12
申請(qǐng)公布號(hào) CN104347066B 申請(qǐng)公布日 2019-11-12
分類號(hào) G10L15/06(2013.01)I; G10L15/16(2006.01)I; G10L25/24(2013.01)I 分類 樂(lè)器;聲學(xué);
發(fā)明人 景亞鵬; 張峰; 吳義堅(jiān) 申請(qǐng)(專利權(quán))人 盛樂(lè)信息技術(shù)(上海)有限公司
代理機(jī)構(gòu) 北京辰權(quán)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 上海掌門科技有限公司
地址 201203 上海市浦東新區(qū)張衡路666弄1號(hào)7樓
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于深層神經(jīng)網(wǎng)絡(luò)的嬰兒啼哭聲識(shí)別方法及系統(tǒng),所述方法包括采集訓(xùn)練用嬰兒啼哭聲數(shù)據(jù);對(duì)所述訓(xùn)練用嬰兒啼哭聲數(shù)據(jù)進(jìn)行分類標(biāo)注;提取每一個(gè)分類標(biāo)注的訓(xùn)練用嬰兒啼哭聲數(shù)據(jù)中每段音頻的梅爾域倒譜系數(shù)以生成訓(xùn)練用數(shù)據(jù)文件;根據(jù)所述訓(xùn)練用數(shù)據(jù)文件并采用逐層預(yù)訓(xùn)練的方式得到深層神經(jīng)網(wǎng)絡(luò)中每一層的初始權(quán)值;根據(jù)深層神經(jīng)網(wǎng)絡(luò)中所有層的初始權(quán)值并采用BP算法獲取所述深層神經(jīng)網(wǎng)絡(luò)的哭聲模型;采集待識(shí)別的嬰兒啼哭聲數(shù)據(jù),提取待識(shí)別的嬰兒啼哭聲數(shù)據(jù)中每段音頻的梅爾域倒譜系數(shù);根據(jù)待識(shí)別的嬰兒啼哭聲數(shù)據(jù)中每段音頻的梅爾域倒譜系數(shù)和所述哭聲模型進(jìn)行哭聲識(shí)別,能夠提高對(duì)嬰兒啼哭聲的識(shí)別率。