一種歌聲合成方法、裝置及可讀存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202011542845.5 | 申請日 | - |
公開(公告)號 | CN112750421A | 公開(公告)日 | 2021-05-04 |
申請公布號 | CN112750421A | 申請公布日 | 2021-05-04 |
分類號 | G10L13/033;G10L13/04;G10L13/10 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 楊喜鵬;郁霖;陳云琳;江明奇;張旭;殷昊 | 申請(專利權(quán))人 | 出門問問(蘇州)信息科技有限公司 |
代理機(jī)構(gòu) | 北京樂知新創(chuàng)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 劉婧 |
地址 | 215000 江蘇省蘇州市蘇州工業(yè)園區(qū)星湖街328號創(chuàng)意產(chǎn)業(yè)園4-B404單元 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種歌聲合成方法、裝置及可讀存儲介質(zhì),該方法包括:獲取用戶朗誦的音頻、音頻對應(yīng)的的歌詞文本;根據(jù)預(yù)設(shè)語音識別模型和歌詞文本對音頻中的第一音素進(jìn)行時長標(biāo)注,得到第一音素的第一時長;確定音頻的第一譜特征;當(dāng)歌詞文本中的第一歌詞和預(yù)設(shè)目標(biāo)歌曲的第二歌詞對應(yīng),根據(jù)預(yù)設(shè)的目標(biāo)歌曲的第二音素的第二時長、第一音素的第一時長對第一譜特征進(jìn)行縮放處理,得到第二譜特征;對第二譜特征、預(yù)設(shè)的目標(biāo)歌曲的第一基頻進(jìn)行合成,得到合成歌聲。本發(fā)明無需收集大量的錄音數(shù)據(jù)就可以實現(xiàn)歌聲合成,可以降低歌聲合成的成本,且合成歌聲更加自然,具有目標(biāo)歌曲原歌手歌唱時的韻律感且能保留用戶原有的音色。 |
