一種音頻標注方法及裝置

基本信息

申請?zhí)?/td> CN201610866294.5 申請日 -
公開(公告)號 CN107886941A 公開(公告)日 2018-04-06
申請公布號 CN107886941A 申請公布日 2018-04-06
分類號 G10L15/02;G10L15/06;G10L19/04;G10L13/08;G06F17/30 分類 樂器;聲學;
發(fā)明人 高玉敏;王志鵬 申請(專利權(quán))人 億覽在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
代理機構(gòu) 北京億騰知識產(chǎn)權(quán)代理事務(wù)所 代理人 億覽在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
地址 100081 北京市海淀區(qū)知春路106號太平洋國際大廈寫字樓9層905-906室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種音頻標注方法及裝置,方法包括:將音頻文件切分成多個音頻片段,并從中選取至少一個音頻片段;提取至少一個音頻片段的聲學特征和圖像特征,所述聲學特征包括調(diào)性和/或頻率分布特征;將至少一個音頻片段中相同的音頻片段的音頻特征和圖像特征進行合成,獲得至少一個音頻片段中相同的音頻片段的特征向量;對至少一個音頻片段的特征向量進行訓(xùn)練和預(yù)測,獲得相應(yīng)的概率分布,選擇概率值中的最大值對應(yīng)的標簽作為音頻文件的標簽,解決了音頻標注時耗費人力資源大、耗時長且標注準確率低的問題,實現(xiàn)了高效率高準確率的音頻標注。