流式語音識別的處理方法、裝置和計算機設備
基本信息
申請?zhí)?/td> | CN202111054122.5 | 申請日 | - |
公開(公告)號 | CN113506575A | 公開(公告)日 | 2021-10-15 |
申請公布號 | CN113506575A | 申請公布日 | 2021-10-15 |
分類號 | G10L15/22(2006.01)I;G10L15/06(2013.01)I;G10L19/022(2013.01)I | 分類 | 樂器;聲學; |
發(fā)明人 | 李杰;王廣新;楊漢丹 | 申請(專利權)人 | 深圳市友杰智新科技有限公司 |
代理機構 | 深圳市明日今典知識產(chǎn)權代理事務所(普通合伙) | 代理人 | 王杰輝 |
地址 | 518000廣東省深圳市南山區(qū)招商街道沿山社區(qū)沿山路22號火炬大廈501 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請?zhí)峁┝艘环N流式語音識別的處理方法、裝置和計算機設備,識別系統(tǒng)采集初始語音數(shù)據(jù),對初始語音數(shù)據(jù)進行一次滑窗處理,得到若干個二次語音數(shù)據(jù)。再按照各個二次語音數(shù)據(jù)的采集時間順序,依次將各個二次語音數(shù)據(jù)輸入預先訓練的語音識別模型進行處理,得到各個初始序列矩陣。每次語音識別模型輸出新的初始序列矩陣時,識別系統(tǒng)將當前時刻的初始序列矩陣與預設數(shù)量個相鄰上一時刻的初始序列矩陣進行拼接,得到二次序列矩陣。在每次得到新的二次序列矩陣時,對二次序列矩陣進行二次滑窗處理,得到最終序列矩陣。識別系統(tǒng)調(diào)用識別算法在所述最終序列矩陣上進行搜索,獲得識別結果,處理速度快,準確度高。 |
