一種實(shí)時(shí)語(yǔ)音端點(diǎn)檢測(cè)方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201811491292.8 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN109545188A | 公開(kāi)(公告)日 | 2021-07-09 |
申請(qǐng)公布號(hào) | CN109545188A | 申請(qǐng)公布日 | 2021-07-09 |
分類號(hào) | G10L15/04;G10L25/03;G10L25/21;G10L25/51;G10L25/78 | 分類 | 樂(lè)器;聲學(xué); |
發(fā)明人 | 張虎 | 申請(qǐng)(專利權(quán))人 | 深圳市友杰智新科技有限公司 |
代理機(jī)構(gòu) | 深圳市深科信知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 彭光榮 |
地址 | 518000 廣東省深圳市南山區(qū)招商街道蛇口南海大道1079號(hào)花園城數(shù)碼大廈A座402 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及語(yǔ)音技術(shù)領(lǐng)域,具體地說(shuō),涉及一種實(shí)時(shí)語(yǔ)音端點(diǎn)檢測(cè)方法及裝置,方法包括以下步驟:信號(hào)分幀、加重;去脈沖處理;去除直流成分;計(jì)算每幀信號(hào)的短時(shí)能量和過(guò)零率;加窗處理;減譜處理;計(jì)算譜熵;計(jì)算變換平滑譜熵;語(yǔ)音幀和噪聲幀初步判斷;變換平滑譜熵與閾值的處理;語(yǔ)音段起始幀、結(jié)束幀判斷;本發(fā)明根據(jù)信號(hào)是根據(jù)何種條件判斷出來(lái)以及判斷的結(jié)果,加權(quán)更新減譜閾值、變換平滑譜熵、相應(yīng)的短時(shí)能量、相應(yīng)的短時(shí)平均能量、減譜功率譜等參數(shù)的閾值,以使各閾值越來(lái)越準(zhǔn)確,最終判斷出的語(yǔ)音起始幀、結(jié)束幀也越來(lái)越準(zhǔn)確;本發(fā)明能高效、準(zhǔn)確地實(shí)時(shí)檢測(cè)語(yǔ)音。 |
