基于音頻生成按鍵時間數(shù)據(jù)的方法和裝置

基本信息

申請?zhí)?/td> CN202010071641.1 申請日 -
公開(公告)號 CN111276113A 公開(公告)日 2020-06-12
申請公布號 CN111276113A 申請公布日 2020-06-12
分類號 G10H1/00(2006.01)I 分類 -
發(fā)明人 林超;徐超 申請(專利權(quán))人 北京永航科技有限公司
代理機(jī)構(gòu) 北京三高永信知識產(chǎn)權(quán)代理有限責(zé)任公司 代理人 北京永航科技有限公司
地址 100013北京市東城區(qū)和平里西街51號雍和宮壹中心A座1號樓
法律狀態(tài) -

摘要

摘要 本申請公開了一種基于音頻生成按鍵時間數(shù)據(jù)的方法和裝置,屬于音頻技術(shù)領(lǐng)域。該方法包括:基于目標(biāo)音頻的音頻幀人聲重音檢測模型,確定目標(biāo)音頻中的人聲音頻對應(yīng)的每個重音時間點(diǎn);基于目標(biāo)音頻的音頻幀和長音檢測模型,確定目標(biāo)音頻數(shù)據(jù)中每個長音音頻對應(yīng)的長音時間段,其中,長音音頻是持續(xù)時長大于預(yù)設(shè)閾值的音頻;基于目標(biāo)音頻的音頻幀和音頻突變檢測模型,確定目標(biāo)音頻的伴奏音頻中存在音頻突變的突變時間點(diǎn);基于重音時間點(diǎn)、突變時間點(diǎn)和拍子時間點(diǎn),生成目標(biāo)音頻對應(yīng)的短按鍵時間數(shù)據(jù)和滑動按鍵時間數(shù)據(jù)中的至少一種,基于長音時間段和拍子時間點(diǎn)生成目標(biāo)音頻對應(yīng)的長按鍵時間數(shù)據(jù)。采用本申請,可以提高生成按鍵時間數(shù)據(jù)的靈活性。??