一種語音識別技術(shù)的結(jié)構(gòu)模型

基本信息

申請?zhí)?/td> CN201811509918.3 申請日 -
公開(公告)號 CN111312227A 公開(公告)日 2020-06-19
申請公布號 CN111312227A 申請公布日 2020-06-19
分類號 G10L15/14(2006.01)I 分類 -
發(fā)明人 鄒燦;張峰 申請(專利權(quán))人 上海元趣信息技術(shù)有限公司
代理機構(gòu) 北京七夏專利代理事務(wù)所(普通合伙) 代理人 上海元趣信息技術(shù)有限公司
地址 200000上海市浦東新區(qū)自由貿(mào)易實驗區(qū)金科路2889弄6號(長泰廣場E座)9層02單元
法律狀態(tài) -

摘要

摘要 本發(fā)明創(chuàng)造屬于語音識別領(lǐng)域,具體涉及了一種語音識別技術(shù)的結(jié)構(gòu)模型。為了解決存在的過程復(fù)雜、運算量大、結(jié)果粗糙而且有矛盾的問題,本發(fā)明創(chuàng)造提出了一種運算量小、訓(xùn)練過程簡單、邏輯通順而且邊界清晰的語音識別技術(shù)的結(jié)構(gòu)模型。本發(fā)明創(chuàng)造所采用的技術(shù)方案是,一種語音識別技術(shù)的結(jié)構(gòu)模型,包括以下步驟:A1:提取語音信號的能量在不同頻率范圍的分布的特征,并進(jìn)行建模;A2:結(jié)合記憶語音時序序列中上下文相關(guān)的信息對輸入的特征信息進(jìn)行抽象輸出;A3:將A2抽象出來的特征映射到獨立空間;A4:通過前向后向算法自動調(diào)整語音標(biāo)注的邊界針對整句進(jìn)行訓(xùn)練從而對時序進(jìn)行建模,并將A3中映射出來的語音的時序信息學(xué)習(xí)到神經(jīng)網(wǎng)絡(luò)參數(shù)中。??