一種實(shí)時(shí)語(yǔ)音端點(diǎn)檢測(cè)方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201811491292.8 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN109545188A 公開(kāi)(公告)日 2021-07-09
申請(qǐng)公布號(hào) CN109545188A 申請(qǐng)公布日 2021-07-09
分類號(hào) G10L15/04;G10L25/03;G10L25/21;G10L25/51;G10L25/78 分類 樂(lè)器;聲學(xué);
發(fā)明人 張虎 申請(qǐng)(專利權(quán))人 深圳市友杰智新科技有限公司
代理機(jī)構(gòu) 深圳市深科信知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 彭光榮
地址 518000 廣東省深圳市南山區(qū)招商街道蛇口南海大道1079號(hào)花園城數(shù)碼大廈A座402
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及語(yǔ)音技術(shù)領(lǐng)域,具體地說(shuō),涉及一種實(shí)時(shí)語(yǔ)音端點(diǎn)檢測(cè)方法及裝置,方法包括以下步驟:信號(hào)分幀、加重;去脈沖處理;去除直流成分;計(jì)算每幀信號(hào)的短時(shí)能量和過(guò)零率;加窗處理;減譜處理;計(jì)算譜熵;計(jì)算變換平滑譜熵;語(yǔ)音幀和噪聲幀初步判斷;變換平滑譜熵與閾值的處理;語(yǔ)音段起始幀、結(jié)束幀判斷;本發(fā)明根據(jù)信號(hào)是根據(jù)何種條件判斷出來(lái)以及判斷的結(jié)果,加權(quán)更新減譜閾值、變換平滑譜熵、相應(yīng)的短時(shí)能量、相應(yīng)的短時(shí)平均能量、減譜功率譜等參數(shù)的閾值,以使各閾值越來(lái)越準(zhǔn)確,最終判斷出的語(yǔ)音起始幀、結(jié)束幀也越來(lái)越準(zhǔn)確;本發(fā)明能高效、準(zhǔn)確地實(shí)時(shí)檢測(cè)語(yǔ)音。