一種基于seq2seq網(wǎng)絡(luò)的歌詞對(duì)齊方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202010059082.2 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN111259188A | 公開(kāi)(公告)日 | 2020-06-09 |
申請(qǐng)公布號(hào) | CN111259188A | 申請(qǐng)公布日 | 2020-06-09 |
分類(lèi)號(hào) | G06F16/61(2019.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 尹學(xué)淵;劉鑫忠;江天宇 | 申請(qǐng)(專(zhuān)利權(quán))人 | 成都嗨翻屋科技有限公司 |
代理機(jī)構(gòu) | 成都睿道專(zhuān)利代理事務(wù)所(普通合伙) | 代理人 | 成都嗨翻屋科技有限公司 |
地址 | 610041四川省成都市高新區(qū)益州大道中段722號(hào)1幢1單元12層1201號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于seq2seq網(wǎng)絡(luò)的歌詞對(duì)齊方法及系統(tǒng),方法包括:對(duì)歌詞進(jìn)行處理得到歌詞向量,對(duì)音頻進(jìn)行處理得到起止時(shí)間與歌詞對(duì)應(yīng)的人聲頻譜圖;采用seq2seq網(wǎng)絡(luò)模型對(duì)歌詞向量和對(duì)應(yīng)的頻譜圖進(jìn)行處理,得到輸入歌詞的注意力矩陣;將注意力矩陣整合解析為字符級(jí)別的對(duì)齊結(jié)果,得到歌詞每個(gè)字的開(kāi)始時(shí)間和結(jié)束時(shí)間。系統(tǒng)包括數(shù)據(jù)處理模塊對(duì)歌詞進(jìn)行處理得到歌詞向量,對(duì)音頻進(jìn)行處理得到起止時(shí)間與歌詞對(duì)應(yīng)的人聲頻譜圖;數(shù)據(jù)預(yù)測(cè)模塊采用網(wǎng)絡(luò)模型對(duì)歌詞向量和對(duì)應(yīng)的頻譜圖進(jìn)行處理,得到輸入歌詞的注意力矩陣;對(duì)齊結(jié)果解析模塊用于將注意力矩陣整合解析為字符級(jí)別的對(duì)齊結(jié)果,得到歌詞每個(gè)字的開(kāi)始時(shí)間和結(jié)束時(shí)間。?? |
