流式語音識別的處理方法、裝置和計算機設(shè)備

基本信息

申請?zhí)?/td> CN202111054122.5 申請日 -
公開(公告)號 CN113506575A 公開(公告)日 2021-10-15
申請公布號 CN113506575A 申請公布日 2021-10-15
分類號 G10L15/22(2006.01)I;G10L15/06(2013.01)I;G10L19/022(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 李杰;王廣新;楊漢丹 申請(專利權(quán))人 深圳市友杰智新科技有限公司
代理機構(gòu) 深圳市明日今典知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 王杰輝
地址 518000廣東省深圳市南山區(qū)招商街道沿山社區(qū)沿山路22號火炬大廈501
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┝艘环N流式語音識別的處理方法、裝置和計算機設(shè)備,識別系統(tǒng)采集初始語音數(shù)據(jù),對初始語音數(shù)據(jù)進(jìn)行一次滑窗處理,得到若干個二次語音數(shù)據(jù)。再按照各個二次語音數(shù)據(jù)的采集時間順序,依次將各個二次語音數(shù)據(jù)輸入預(yù)先訓(xùn)練的語音識別模型進(jìn)行處理,得到各個初始序列矩陣。每次語音識別模型輸出新的初始序列矩陣時,識別系統(tǒng)將當(dāng)前時刻的初始序列矩陣與預(yù)設(shè)數(shù)量個相鄰上一時刻的初始序列矩陣進(jìn)行拼接,得到二次序列矩陣。在每次得到新的二次序列矩陣時,對二次序列矩陣進(jìn)行二次滑窗處理,得到最終序列矩陣。識別系統(tǒng)調(diào)用識別算法在所述最終序列矩陣上進(jìn)行搜索,獲得識別結(jié)果,處理速度快,準(zhǔn)確度高。