基于自適應算法的非對稱語料庫條件下的語音轉(zhuǎn)換方法

基本信息

申請?zhí)?/td> CN201310146293.X 申請日 -
公開(公告)號 CN103280224B 公開(公告)日 2015-09-16
申請公布號 CN103280224B 申請公布日 2015-09-16
分類號 G10L21/00(2013.01)I;G10L15/07(2013.01)I 分類 樂器;聲學;
發(fā)明人 宋鵬;包永強;趙力;劉健剛 申請(專利權)人 南京宇音力新電子科技有限公司
代理機構 南京蘇高專利商標事務所(普通合伙) 代理人 東南大學;上海泰宇信息技術股份有限公司
地址 210096 江蘇省南京市玄武區(qū)四牌樓2號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于自適應算法的非對稱語料庫條件下的語音轉(zhuǎn)換方法,首先運用MAP算法利用少量訓練語句從參考說話人模型中分別訓練得到源說話人和目標說話人的模型。然后,利用自適應說話人模型中的參數(shù),分別提出了高斯歸一化和均值轉(zhuǎn)換的方法。并且為了進一步提高轉(zhuǎn)換效果,進而提出了將高斯歸一化方法和均值轉(zhuǎn)換融合的方法。同時,由于訓練語句有限,必然影響自適應模型的準確性,本發(fā)明提出了KL散度的方法在轉(zhuǎn)換時對說話人模型進行優(yōu)化,主客觀實驗結(jié)果表明:無論是頻譜失真度,還是轉(zhuǎn)換語音的質(zhì)量以及與目標語音的相似度。本發(fā)明提出的方法都獲得了和基于對稱語料庫條件下的經(jīng)典GMM方法可比擬的效果。