基于音頻生成按鍵時(shí)間數(shù)據(jù)的方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN202010071641.1 申請(qǐng)日 -
公開(公告)號(hào) CN111276113A 公開(公告)日 2020-06-12
申請(qǐng)公布號(hào) CN111276113A 申請(qǐng)公布日 2020-06-12
分類號(hào) G10H1/00(2006.01)I 分類 -
發(fā)明人 林超;徐超 申請(qǐng)(專利權(quán))人 北京永航科技有限公司
代理機(jī)構(gòu) 北京三高永信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 代理人 北京永航科技有限公司
地址 100013北京市東城區(qū)和平里西街51號(hào)雍和宮壹中心A座1號(hào)樓
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開了一種基于音頻生成按鍵時(shí)間數(shù)據(jù)的方法和裝置,屬于音頻技術(shù)領(lǐng)域。該方法包括:基于目標(biāo)音頻的音頻幀人聲重音檢測(cè)模型,確定目標(biāo)音頻中的人聲音頻對(duì)應(yīng)的每個(gè)重音時(shí)間點(diǎn);基于目標(biāo)音頻的音頻幀和長(zhǎng)音檢測(cè)模型,確定目標(biāo)音頻數(shù)據(jù)中每個(gè)長(zhǎng)音音頻對(duì)應(yīng)的長(zhǎng)音時(shí)間段,其中,長(zhǎng)音音頻是持續(xù)時(shí)長(zhǎng)大于預(yù)設(shè)閾值的音頻;基于目標(biāo)音頻的音頻幀和音頻突變檢測(cè)模型,確定目標(biāo)音頻的伴奏音頻中存在音頻突變的突變時(shí)間點(diǎn);基于重音時(shí)間點(diǎn)、突變時(shí)間點(diǎn)和拍子時(shí)間點(diǎn),生成目標(biāo)音頻對(duì)應(yīng)的短按鍵時(shí)間數(shù)據(jù)和滑動(dòng)按鍵時(shí)間數(shù)據(jù)中的至少一種,基于長(zhǎng)音時(shí)間段和拍子時(shí)間點(diǎn)生成目標(biāo)音頻對(duì)應(yīng)的長(zhǎng)按鍵時(shí)間數(shù)據(jù)。采用本申請(qǐng),可以提高生成按鍵時(shí)間數(shù)據(jù)的靈活性。??