有效語音識別方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN201510055655.3 | 申請日 | - |
公開(公告)號 | CN104575498B | 公開(公告)日 | 2018-08-17 |
申請公布號 | CN104575498B | 申請公布日 | 2018-08-17 |
分類號 | G10L15/20 | 分類 | 樂器;聲學; |
發(fā)明人 | 付姝華 | 申請(專利權)人 | 深圳市云之訊網(wǎng)絡技術有限公司 |
代理機構 | 廣州市越秀區(qū)哲力專利商標事務所(普通合伙) | 代理人 | 深圳市云之訊網(wǎng)絡技術有限公司 |
地址 | 518000 廣東省深圳市南山區(qū)高新南四道8號創(chuàng)維半導體設計大廈東座18樓1802室 | ||
法律狀態(tài) | - |
摘要
摘要 | 有效語音識別方法及系統(tǒng),方法包括以下步驟:步驟A:實時獲取當前語音幀的語音頻譜分布;步驟B:實時獲取當前語音幀的短時能量和長時能量;步驟C:根據(jù)語音頻譜分布、長時能量和短時能量獲取語音類似度;以及步驟D:判斷語音類似度是否大于預設的語音類似度閾值,若是,執(zhí)行步驟E;若否,執(zhí)行步驟F;步驟E:判定當前語音幀為有效語音;以及步驟F:判定當前語音幀為非語音。上述發(fā)明實時獲取每一語音幀的語音頻譜分布和能量變化,并根據(jù)語音頻譜分布和能量變化快速識別出有效語音,無需像傳統(tǒng)方法那樣結合多幀才能綜合判斷,故,即使所應用的場景頻繁切換也能可靠快速地識別。 |
