一種語音端點檢測方法
基本信息
申請?zhí)?/td> | CN201910288454.6 | 申請日 | - |
公開(公告)號 | CN110047470A | 公開(公告)日 | 2019-07-23 |
申請公布號 | CN110047470A | 申請公布日 | 2019-07-23 |
分類號 | G10L15/04;G10L15/18;G10L21/0232;G10L25/21;G10L25/45;G10L25/60 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 左靖東;況鵬;范振;詹佳麗;黎寧 | 申請(專利權(quán))人 | 深圳市壹鴿科技有限公司 |
代理機構(gòu) | 深圳叁眾知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 深圳市壹鴿科技有限公司 |
地址 | 518000 廣東省深圳市南山區(qū)粵海街道高新區(qū)社區(qū)高新南七道011號高新工業(yè)村T3棟3AA | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種語音端點檢測方法,通過多窗譜減算法,將有噪聲環(huán)境下的語音信號減噪,對語音進行增強,計算增強后語音的頻域信號能量,并將該能量作為語音檢測時的特征;分別計算每一幀的短時和長時能量均值作為每一幀對應(yīng)的得分值和判決閾值,根據(jù)所述得分值和判決閾值的大小進行語音或非語音判決;最后,根據(jù)語義意圖自適應(yīng)調(diào)整說話間隙時長,判決出完整一句話的起止點位置。其具有較低的復(fù)雜度和計算量,并在復(fù)雜環(huán)境下具有很好的魯棒性;不需要對各種環(huán)境噪聲有先驗知識,也能適應(yīng)非平穩(wěn)的各類噪聲背景。 |
