一種端到端的口音轉(zhuǎn)換方法

基本信息

申請(qǐng)?zhí)?/td> CN202010239586.2 申請(qǐng)日 -
公開(公告)號(hào) CN111462769A 公開(公告)日 2020-07-28
申請(qǐng)公布號(hào) CN111462769A 申請(qǐng)公布日 2020-07-28
分類號(hào) G10L21/013(2013.01)I 分類 -
發(fā)明人 劉頌湘;王迪松;曹悅雯;孫立發(fā);吳錫欣;康世胤;吳志勇;劉循英;蒙美玲 申請(qǐng)(專利權(quán))人 深圳市聲希科技有限公司
代理機(jī)構(gòu) 北京聯(lián)瑞聯(lián)豐知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 深圳市聲??萍加邢薰?/td>
地址 518101廣東省深圳市寶安區(qū)新安街道興東社區(qū)留仙大道2號(hào)匯聚創(chuàng)新園2棟2710
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種端到端的口音轉(zhuǎn)換方法,將非地道口音轉(zhuǎn)換為地道口音,屬于語音處理技術(shù)領(lǐng)域,也可用于將發(fā)音障礙的患者的語音轉(zhuǎn)換為標(biāo)準(zhǔn)語音,包括實(shí)現(xiàn)口音轉(zhuǎn)換方法的口音轉(zhuǎn)換系統(tǒng),口音轉(zhuǎn)換系統(tǒng)包括語音識(shí)別模塊、說話人編碼器、語音合成模塊、神經(jīng)網(wǎng)絡(luò)聲碼器,語音識(shí)別模塊用于將輸入的非地道口音的聲學(xué)特征調(diào)整為地道口音的信號(hào)參數(shù),信號(hào)參數(shù)僅與非地道口音的說話內(nèi)容相關(guān);非地道口音的信號(hào)參數(shù)和說話人向量輸入至語音合成模塊,經(jīng)語音合成模塊處理過的語音最后通過神經(jīng)網(wǎng)絡(luò)聲碼器即可合成特定說話人的地道口音;有益效果是:在轉(zhuǎn)換過程中無需地道口音參考音頻的任何指導(dǎo),即能夠?qū)⒎堑氐揽谝艮D(zhuǎn)換為地道口音,并且保持說話人的原本音色。??