真實場景下的嬰兒哭聲檢測方法、裝置及可讀介質

基本信息

申請?zhí)?/td> CN202111042258.4 申請日 -
公開(公告)號 CN113488077A 公開(公告)日 2021-10-08
申請公布號 CN113488077A 申請公布日 2021-10-08
分類號 G10L25/63(2013.01)I;G10L25/30(2013.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 樂器;聲學;
發(fā)明人 不公告發(fā)明人 申請(專利權)人 珠海億智電子科技有限公司
代理機構 廣州嘉權專利商標事務所有限公司 代理人 張志輝
地址 519080廣東省珠海市高新區(qū)唐家灣鎮(zhèn)港樂路8號大洲科技園B區(qū)廠房803室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種真實場景下的嬰兒哭聲檢測方法、裝置及可讀介質的技術方案,包括:采集真實場景下包括有嬰兒哭聲的音頻數(shù)據,將音頻數(shù)據作為數(shù)據集進行標注及前處理,得到網絡輸入數(shù)據;將網絡輸入數(shù)據輸入至包括有特征提取網絡、人聲檢測網絡及哭聲檢測網絡的深度神經網絡,并分別進行特征提取、人聲檢測及哭聲檢測的訓練,得到人聲檢測網絡和哭聲檢測網絡對應的第一損失函數(shù)及第二損失函數(shù);對深度神經網絡整體進行訓練得到第三損失函數(shù),得到嬰兒哭聲檢測模型;通過嬰兒哭聲檢測模型對輸入的真實場景采集的音頻數(shù)據進行檢測,得到真實場景的嬰兒哭聲檢測結果。本發(fā)明的有益效果為:能夠在相對較短的時間內較為準確地檢測出嬰兒哭聲。