一種實(shí)時(shí)語音端點(diǎn)檢測方法及裝置
基本信息
申請?zhí)?/td> | CN201811491292.8 | 申請日 | - |
公開(公告)號 | CN109545188A | 公開(公告)日 | 2021-07-09 |
申請公布號 | CN109545188A | 申請公布日 | 2021-07-09 |
分類號 | G10L15/04;G10L25/03;G10L25/21;G10L25/51;G10L25/78 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 張虎 | 申請(專利權(quán))人 | 深圳市友杰智新科技有限公司 |
代理機(jī)構(gòu) | 深圳市深科信知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 彭光榮 |
地址 | 518000 廣東省深圳市南山區(qū)招商街道蛇口南海大道1079號花園城數(shù)碼大廈A座402 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及語音技術(shù)領(lǐng)域,具體地說,涉及一種實(shí)時(shí)語音端點(diǎn)檢測方法及裝置,方法包括以下步驟:信號分幀、加重;去脈沖處理;去除直流成分;計(jì)算每幀信號的短時(shí)能量和過零率;加窗處理;減譜處理;計(jì)算譜熵;計(jì)算變換平滑譜熵;語音幀和噪聲幀初步判斷;變換平滑譜熵與閾值的處理;語音段起始幀、結(jié)束幀判斷;本發(fā)明根據(jù)信號是根據(jù)何種條件判斷出來以及判斷的結(jié)果,加權(quán)更新減譜閾值、變換平滑譜熵、相應(yīng)的短時(shí)能量、相應(yīng)的短時(shí)平均能量、減譜功率譜等參數(shù)的閾值,以使各閾值越來越準(zhǔn)確,最終判斷出的語音起始幀、結(jié)束幀也越來越準(zhǔn)確;本發(fā)明能高效、準(zhǔn)確地實(shí)時(shí)檢測語音。 |
