流式語音識別的處理方法、裝置和計算機設備

基本信息

申請?zhí)?/td> CN202111054122.5 申請日 -
公開(公告)號 CN113506575A 公開(公告)日 2021-10-15
申請公布號 CN113506575A 申請公布日 2021-10-15
分類號 G10L15/22(2006.01)I;G10L15/06(2013.01)I;G10L19/022(2013.01)I 分類 樂器;聲學;
發(fā)明人 李杰;王廣新;楊漢丹 申請(專利權)人 深圳市友杰智新科技有限公司
代理機構 深圳市明日今典知識產(chǎn)權代理事務所(普通合伙) 代理人 王杰輝
地址 518000廣東省深圳市南山區(qū)招商街道沿山社區(qū)沿山路22號火炬大廈501
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┝艘环N流式語音識別的處理方法、裝置和計算機設備,識別系統(tǒng)采集初始語音數(shù)據(jù),對初始語音數(shù)據(jù)進行一次滑窗處理,得到若干個二次語音數(shù)據(jù)。再按照各個二次語音數(shù)據(jù)的采集時間順序,依次將各個二次語音數(shù)據(jù)輸入預先訓練的語音識別模型進行處理,得到各個初始序列矩陣。每次語音識別模型輸出新的初始序列矩陣時,識別系統(tǒng)將當前時刻的初始序列矩陣與預設數(shù)量個相鄰上一時刻的初始序列矩陣進行拼接,得到二次序列矩陣。在每次得到新的二次序列矩陣時,對二次序列矩陣進行二次滑窗處理,得到最終序列矩陣。識別系統(tǒng)調(diào)用識別算法在所述最終序列矩陣上進行搜索,獲得識別結果,處理速度快,準確度高。