一種端到端的口音轉(zhuǎn)換方法
基本信息
申請(qǐng)?zhí)?/td> | CN202010239586.2 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN111462769A | 公開(公告)日 | 2020-07-28 |
申請(qǐng)公布號(hào) | CN111462769A | 申請(qǐng)公布日 | 2020-07-28 |
分類號(hào) | G10L21/013(2013.01)I | 分類 | - |
發(fā)明人 | 劉頌湘;王迪松;曹悅雯;孫立發(fā);吳錫欣;康世胤;吳志勇;劉循英;蒙美玲 | 申請(qǐng)(專利權(quán))人 | 深圳市聲希科技有限公司 |
代理機(jī)構(gòu) | 北京聯(lián)瑞聯(lián)豐知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 深圳市聲??萍加邢薰?/td> |
地址 | 518101廣東省深圳市寶安區(qū)新安街道興東社區(qū)留仙大道2號(hào)匯聚創(chuàng)新園2棟2710 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種端到端的口音轉(zhuǎn)換方法,將非地道口音轉(zhuǎn)換為地道口音,屬于語音處理技術(shù)領(lǐng)域,也可用于將發(fā)音障礙的患者的語音轉(zhuǎn)換為標(biāo)準(zhǔn)語音,包括實(shí)現(xiàn)口音轉(zhuǎn)換方法的口音轉(zhuǎn)換系統(tǒng),口音轉(zhuǎn)換系統(tǒng)包括語音識(shí)別模塊、說話人編碼器、語音合成模塊、神經(jīng)網(wǎng)絡(luò)聲碼器,語音識(shí)別模塊用于將輸入的非地道口音的聲學(xué)特征調(diào)整為地道口音的信號(hào)參數(shù),信號(hào)參數(shù)僅與非地道口音的說話內(nèi)容相關(guān);非地道口音的信號(hào)參數(shù)和說話人向量輸入至語音合成模塊,經(jīng)語音合成模塊處理過的語音最后通過神經(jīng)網(wǎng)絡(luò)聲碼器即可合成特定說話人的地道口音;有益效果是:在轉(zhuǎn)換過程中無需地道口音參考音頻的任何指導(dǎo),即能夠?qū)⒎堑氐揽谝艮D(zhuǎn)換為地道口音,并且保持說話人的原本音色。?? |
