訓練數(shù)據(jù)的篩選方法、裝置、設備和存儲介質

基本信息

申請?zhí)?/td> CN202110927090.9 申請日 -
公開(公告)號 CN113496698A 公開(公告)日 2021-10-12
申請公布號 CN113496698A 申請公布日 2021-10-12
分類號 G10L15/06(2013.01)I;G10L15/08(2006.01)I;G10L15/16(2006.01)I;G10L15/22(2006.01)I;G10L25/03(2013.01)I;G10L25/51(2013.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 樂器;聲學;
發(fā)明人 關海欣;梁家恩 申請(專利權)人 云知聲智能科技股份有限公司
代理機構 - 代理人 -
地址 100096北京市海淀區(qū)西三旗建材城內(nèi)1幢一層101號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種訓練數(shù)據(jù)的篩選方法、裝置、設備和存儲介質,方法包括:將獲取的待篩選數(shù)據(jù)輸入預先構建的語音活動檢測模型進行檢測,得到待篩選數(shù)據(jù)的語音幀和噪音幀;根據(jù)獲取的語音幀級平均能量和噪音幀級平均能量,確定待篩選數(shù)據(jù)的信噪比;若信噪比大于第一預設閾值,對待篩選數(shù)據(jù)進行混響抑制,得到抑制數(shù)據(jù);根據(jù)語音幀級平均能量和獲取的抑制數(shù)據(jù)的平均能量,確定混響分量的平均能量;根據(jù)混響分量的平均能量和語音幀級平均能量,確定混響占比;若混響占比小于第二預設閾值,保留待篩選數(shù)據(jù),實現(xiàn)了自動篩選訓練數(shù)據(jù),提高了訓練數(shù)據(jù)的篩選效率。