一種語音建模方法及裝置

基本信息

申請?zhí)?/td> CN201811390640.2 申請日 -
公開(公告)號 CN109243429A 公開(公告)日 2019-01-18
申請公布號 CN109243429A 申請公布日 2019-01-18
分類號 G10L15/14;G10L15/02;G10L25/24 分類 樂器;聲學;
發(fā)明人 唐浩元;王佳珺;王歡良;馬殿昌 申請(專利權)人 蘇州奇夢者科技有限公司
代理機構 蘇州國誠專利代理有限公司 代理人 蘇州奇夢者網絡科技有限公司
地址 215024 江蘇省蘇州市工業(yè)園區(qū)若水路388號納米技術國家大學科技園E棟1604
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種語音建模方法及裝置,所述方法包括:獲取在簡單場景下錄制的第一語音信號;獲取所述第一語音信號的第一音素對齊序列;向所述第一語音信號添加信道畸變、混響和噪聲,生成仿真語音信號;對所述仿真語音信號中的非語音段進行分類,并對每一類分別建立對應的一個用于建模的目標音素;根據所述仿真語音信號中的噪聲類別,將所述仿真語音信號中的第二音素對齊序列中的非語音段噪聲音素分別替換成對應的所述目標音素;其中,所述第二音素對齊序列與所述第一音素對齊序列相同;基于替換后的所述仿真語音信號生成目標聲學模型。本發(fā)明可以提高在目標復雜場景下的語音識別性能。