基于深層神經(jīng)網(wǎng)絡(luò)的嬰兒啼哭聲識(shí)別方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN201310347807.8 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN104347066B | 公開(kāi)(公告)日 | 2019-11-12 |
申請(qǐng)公布號(hào) | CN104347066B | 申請(qǐng)公布日 | 2019-11-12 |
分類號(hào) | G10L15/06(2013.01)I; G10L15/16(2006.01)I; G10L25/24(2013.01)I | 分類 | 樂(lè)器;聲學(xué); |
發(fā)明人 | 景亞鵬; 張峰; 吳義堅(jiān) | 申請(qǐng)(專利權(quán))人 | 盛樂(lè)信息技術(shù)(上海)有限公司 |
代理機(jī)構(gòu) | 北京辰權(quán)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 上海掌門科技有限公司 |
地址 | 201203 上海市浦東新區(qū)張衡路666弄1號(hào)7樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種基于深層神經(jīng)網(wǎng)絡(luò)的嬰兒啼哭聲識(shí)別方法及系統(tǒng),所述方法包括采集訓(xùn)練用嬰兒啼哭聲數(shù)據(jù);對(duì)所述訓(xùn)練用嬰兒啼哭聲數(shù)據(jù)進(jìn)行分類標(biāo)注;提取每一個(gè)分類標(biāo)注的訓(xùn)練用嬰兒啼哭聲數(shù)據(jù)中每段音頻的梅爾域倒譜系數(shù)以生成訓(xùn)練用數(shù)據(jù)文件;根據(jù)所述訓(xùn)練用數(shù)據(jù)文件并采用逐層預(yù)訓(xùn)練的方式得到深層神經(jīng)網(wǎng)絡(luò)中每一層的初始權(quán)值;根據(jù)深層神經(jīng)網(wǎng)絡(luò)中所有層的初始權(quán)值并采用BP算法獲取所述深層神經(jīng)網(wǎng)絡(luò)的哭聲模型;采集待識(shí)別的嬰兒啼哭聲數(shù)據(jù),提取待識(shí)別的嬰兒啼哭聲數(shù)據(jù)中每段音頻的梅爾域倒譜系數(shù);根據(jù)待識(shí)別的嬰兒啼哭聲數(shù)據(jù)中每段音頻的梅爾域倒譜系數(shù)和所述哭聲模型進(jìn)行哭聲識(shí)別,能夠提高對(duì)嬰兒啼哭聲的識(shí)別率。 |
