基于音頻生成按鍵時(shí)間數(shù)據(jù)的方法和裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202010071641.1 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN111276113A | 公開(公告)日 | 2020-06-12 |
申請(qǐng)公布號(hào) | CN111276113A | 申請(qǐng)公布日 | 2020-06-12 |
分類號(hào) | G10H1/00(2006.01)I | 分類 | - |
發(fā)明人 | 林超;徐超 | 申請(qǐng)(專利權(quán))人 | 北京永航科技有限公司 |
代理機(jī)構(gòu) | 北京三高永信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 | 代理人 | 北京永航科技有限公司 |
地址 | 100013北京市東城區(qū)和平里西街51號(hào)雍和宮壹中心A座1號(hào)樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開了一種基于音頻生成按鍵時(shí)間數(shù)據(jù)的方法和裝置,屬于音頻技術(shù)領(lǐng)域。該方法包括:基于目標(biāo)音頻的音頻幀人聲重音檢測(cè)模型,確定目標(biāo)音頻中的人聲音頻對(duì)應(yīng)的每個(gè)重音時(shí)間點(diǎn);基于目標(biāo)音頻的音頻幀和長(zhǎng)音檢測(cè)模型,確定目標(biāo)音頻數(shù)據(jù)中每個(gè)長(zhǎng)音音頻對(duì)應(yīng)的長(zhǎng)音時(shí)間段,其中,長(zhǎng)音音頻是持續(xù)時(shí)長(zhǎng)大于預(yù)設(shè)閾值的音頻;基于目標(biāo)音頻的音頻幀和音頻突變檢測(cè)模型,確定目標(biāo)音頻的伴奏音頻中存在音頻突變的突變時(shí)間點(diǎn);基于重音時(shí)間點(diǎn)、突變時(shí)間點(diǎn)和拍子時(shí)間點(diǎn),生成目標(biāo)音頻對(duì)應(yīng)的短按鍵時(shí)間數(shù)據(jù)和滑動(dòng)按鍵時(shí)間數(shù)據(jù)中的至少一種,基于長(zhǎng)音時(shí)間段和拍子時(shí)間點(diǎn)生成目標(biāo)音頻對(duì)應(yīng)的長(zhǎng)按鍵時(shí)間數(shù)據(jù)。采用本申請(qǐng),可以提高生成按鍵時(shí)間數(shù)據(jù)的靈活性。?? |
