一種實時語音端點檢測方法及裝置
基本信息
申請?zhí)?/td> | CN201811491292.8 | 申請日 | - |
公開(公告)號 | CN109545188B | 公開(公告)日 | 2021-07-09 |
申請公布號 | CN109545188B | 申請公布日 | 2021-07-09 |
分類號 | G10L15/04;G10L25/03;G10L25/21;G10L25/51;G10L25/78 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 張虎 | 申請(專利權(quán))人 | 深圳市友杰智新科技有限公司 |
代理機構(gòu) | 深圳市深可信專利代理有限公司 | 代理人 | 劉昌剛 |
地址 | 518000 廣東省深圳市南山區(qū)招商街道蛇口南海大道1079號花園城數(shù)碼大廈A座402 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及語音技術(shù)領(lǐng)域,具體地說,涉及一種實時語音端點檢測方法及裝置,方法包括以下步驟:信號分幀、加重;去脈沖處理;去除直流成分;計算每幀信號的短時能量和過零率;加窗處理;減譜處理;計算譜熵;計算變換平滑譜熵;語音幀和噪聲幀初步判斷;變換平滑譜熵與閾值的處理;語音段起始幀、結(jié)束幀判斷;本發(fā)明根據(jù)信號是根據(jù)何種條件判斷出來以及判斷的結(jié)果,加權(quán)更新減譜閾值、變換平滑譜熵、相應(yīng)的短時能量、相應(yīng)的短時平均能量、減譜功率譜等參數(shù)的閾值,以使各閾值越來越準(zhǔn)確,最終判斷出的語音起始幀、結(jié)束幀也越來越準(zhǔn)確;本發(fā)明能高效、準(zhǔn)確地實時檢測語音。 |
