真實場景下的嬰兒哭聲檢測方法、裝置及可讀介質
基本信息
申請?zhí)?/td> | CN202111042258.4 | 申請日 | - |
公開(公告)號 | CN113488077A | 公開(公告)日 | 2021-10-08 |
申請公布號 | CN113488077A | 申請公布日 | 2021-10-08 |
分類號 | G10L25/63(2013.01)I;G10L25/30(2013.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 樂器;聲學; |
發(fā)明人 | 不公告發(fā)明人 | 申請(專利權)人 | 珠海億智電子科技有限公司 |
代理機構 | 廣州嘉權專利商標事務所有限公司 | 代理人 | 張志輝 |
地址 | 519080廣東省珠海市高新區(qū)唐家灣鎮(zhèn)港樂路8號大洲科技園B區(qū)廠房803室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種真實場景下的嬰兒哭聲檢測方法、裝置及可讀介質的技術方案,包括:采集真實場景下包括有嬰兒哭聲的音頻數(shù)據,將音頻數(shù)據作為數(shù)據集進行標注及前處理,得到網絡輸入數(shù)據;將網絡輸入數(shù)據輸入至包括有特征提取網絡、人聲檢測網絡及哭聲檢測網絡的深度神經網絡,并分別進行特征提取、人聲檢測及哭聲檢測的訓練,得到人聲檢測網絡和哭聲檢測網絡對應的第一損失函數(shù)及第二損失函數(shù);對深度神經網絡整體進行訓練得到第三損失函數(shù),得到嬰兒哭聲檢測模型;通過嬰兒哭聲檢測模型對輸入的真實場景采集的音頻數(shù)據進行檢測,得到真實場景的嬰兒哭聲檢測結果。本發(fā)明的有益效果為:能夠在相對較短的時間內較為準確地檢測出嬰兒哭聲。 |
