一種歌聲合成方法、裝置及可讀存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202011542845.5 申請日 -
公開(公告)號 CN112750421A 公開(公告)日 2021-05-04
申請公布號 CN112750421A 申請公布日 2021-05-04
分類號 G10L13/033;G10L13/04;G10L13/10 分類 樂器;聲學(xué);
發(fā)明人 楊喜鵬;郁霖;陳云琳;江明奇;張旭;殷昊 申請(專利權(quán))人 出門問問(蘇州)信息科技有限公司
代理機(jī)構(gòu) 北京樂知新創(chuàng)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 劉婧
地址 215000 江蘇省蘇州市蘇州工業(yè)園區(qū)星湖街328號創(chuàng)意產(chǎn)業(yè)園4-B404單元
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種歌聲合成方法、裝置及可讀存儲介質(zhì),該方法包括:獲取用戶朗誦的音頻、音頻對應(yīng)的的歌詞文本;根據(jù)預(yù)設(shè)語音識別模型和歌詞文本對音頻中的第一音素進(jìn)行時長標(biāo)注,得到第一音素的第一時長;確定音頻的第一譜特征;當(dāng)歌詞文本中的第一歌詞和預(yù)設(shè)目標(biāo)歌曲的第二歌詞對應(yīng),根據(jù)預(yù)設(shè)的目標(biāo)歌曲的第二音素的第二時長、第一音素的第一時長對第一譜特征進(jìn)行縮放處理,得到第二譜特征;對第二譜特征、預(yù)設(shè)的目標(biāo)歌曲的第一基頻進(jìn)行合成,得到合成歌聲。本發(fā)明無需收集大量的錄音數(shù)據(jù)就可以實現(xiàn)歌聲合成,可以降低歌聲合成的成本,且合成歌聲更加自然,具有目標(biāo)歌曲原歌手歌唱時的韻律感且能保留用戶原有的音色。