一種語音建模方法及裝置

基本信息

申請?zhí)?/td> CN201811390640.2 申請日 -
公開(公告)號 CN109243429B 公開(公告)日 2021-12-10
申請公布號 CN109243429B 申請公布日 2021-12-10
分類號 G10L15/14;G10L15/02;G10L25/24 分類 樂器;聲學(xué);
發(fā)明人 唐浩元;王佳珺;王歡良;馬殿昌 申請(專利權(quán))人 蘇州奇夢者科技有限公司
代理機構(gòu) 蘇州國誠專利代理有限公司 代理人 秦開舉
地址 215024 江蘇省蘇州市工業(yè)園區(qū)若水路388號納米技術(shù)國家大學(xué)科技園E棟1604
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種語音建模方法及裝置,所述方法包括:獲取在簡單場景下錄制的第一語音信號;獲取所述第一語音信號的第一音素對齊序列;向所述第一語音信號添加信道畸變、混響和噪聲,生成仿真語音信號;對所述仿真語音信號中的非語音段進行分類,并對每一類分別建立對應(yīng)的一個用于建模的目標(biāo)音素;根據(jù)所述仿真語音信號中的噪聲類別,將所述仿真語音信號中的第二音素對齊序列中的非語音段噪聲音素分別替換成對應(yīng)的所述目標(biāo)音素;其中,所述第二音素對齊序列與所述第一音素對齊序列相同;基于替換后的所述仿真語音信號生成目標(biāo)聲學(xué)模型。本發(fā)明可以提高在目標(biāo)復(fù)雜場景下的語音識別性能。