基于音頻生成按鍵時間數(shù)據(jù)的方法和裝置
基本信息
申請?zhí)?/td> | CN202010071641.1 | 申請日 | - |
公開(公告)號 | CN111276113A | 公開(公告)日 | 2020-06-12 |
申請公布號 | CN111276113A | 申請公布日 | 2020-06-12 |
分類號 | G10H1/00(2006.01)I | 分類 | - |
發(fā)明人 | 林超;徐超 | 申請(專利權(quán))人 | 北京永航科技有限公司 |
代理機(jī)構(gòu) | 北京三高永信知識產(chǎn)權(quán)代理有限責(zé)任公司 | 代理人 | 北京永航科技有限公司 |
地址 | 100013北京市東城區(qū)和平里西街51號雍和宮壹中心A座1號樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了一種基于音頻生成按鍵時間數(shù)據(jù)的方法和裝置,屬于音頻技術(shù)領(lǐng)域。該方法包括:基于目標(biāo)音頻的音頻幀人聲重音檢測模型,確定目標(biāo)音頻中的人聲音頻對應(yīng)的每個重音時間點(diǎn);基于目標(biāo)音頻的音頻幀和長音檢測模型,確定目標(biāo)音頻數(shù)據(jù)中每個長音音頻對應(yīng)的長音時間段,其中,長音音頻是持續(xù)時長大于預(yù)設(shè)閾值的音頻;基于目標(biāo)音頻的音頻幀和音頻突變檢測模型,確定目標(biāo)音頻的伴奏音頻中存在音頻突變的突變時間點(diǎn);基于重音時間點(diǎn)、突變時間點(diǎn)和拍子時間點(diǎn),生成目標(biāo)音頻對應(yīng)的短按鍵時間數(shù)據(jù)和滑動按鍵時間數(shù)據(jù)中的至少一種,基于長音時間段和拍子時間點(diǎn)生成目標(biāo)音頻對應(yīng)的長按鍵時間數(shù)據(jù)。采用本申請,可以提高生成按鍵時間數(shù)據(jù)的靈活性。?? |
