一種語音端點檢測方法

基本信息

申請?zhí)?/td> CN201910288454.6 申請日 -
公開(公告)號 CN110047470A 公開(公告)日 2019-07-23
申請公布號 CN110047470A 申請公布日 2019-07-23
分類號 G10L15/04;G10L15/18;G10L21/0232;G10L25/21;G10L25/45;G10L25/60 分類 樂器;聲學(xué);
發(fā)明人 左靖東;況鵬;范振;詹佳麗;黎寧 申請(專利權(quán))人 深圳市壹鴿科技有限公司
代理機構(gòu) 深圳叁眾知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 深圳市壹鴿科技有限公司
地址 518000 廣東省深圳市南山區(qū)粵海街道高新區(qū)社區(qū)高新南七道011號高新工業(yè)村T3棟3AA
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種語音端點檢測方法,通過多窗譜減算法,將有噪聲環(huán)境下的語音信號減噪,對語音進行增強,計算增強后語音的頻域信號能量,并將該能量作為語音檢測時的特征;分別計算每一幀的短時和長時能量均值作為每一幀對應(yīng)的得分值和判決閾值,根據(jù)所述得分值和判決閾值的大小進行語音或非語音判決;最后,根據(jù)語義意圖自適應(yīng)調(diào)整說話間隙時長,判決出完整一句話的起止點位置。其具有較低的復(fù)雜度和計算量,并在復(fù)雜環(huán)境下具有很好的魯棒性;不需要對各種環(huán)境噪聲有先驗知識,也能適應(yīng)非平穩(wěn)的各類噪聲背景。