一種音視頻數(shù)據(jù)的摘要生成方法、裝置、設(shè)備和存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202111124453.1 申請日 -
公開(公告)號 CN113891177A 公開(公告)日 2022-01-04
申請公布號 CN113891177A 申請公布日 2022-01-04
分類號 H04N21/8549(2011.01)I;H04N21/233(2011.01)I;H04N21/439(2011.01)I;G10L15/04(2013.01)I;G10L15/14(2006.01)I;G10L15/16(2006.01)I;G10L15/06(2013.01)I 分類 電通信技術(shù);
發(fā)明人 徐波 申請(專利權(quán))人 廣州多益網(wǎng)絡(luò)股份有限公司
代理機(jī)構(gòu) 北京集佳知識產(chǎn)權(quán)代理有限公司 代理人 許慶勝
地址 510000廣東省廣州市蘿崗區(qū)伴河路90號自編一棟305房
法律狀態(tài) -

摘要

摘要 本申請公開了一種音視頻數(shù)據(jù)的摘要生成方法、裝置、設(shè)備和存儲介質(zhì),其中方法包括:獲取待分析音視頻數(shù)據(jù)中的語音幀數(shù)據(jù);對所述語音幀數(shù)據(jù)進(jìn)行說話人變化的分段,得到若干分段語音數(shù)據(jù);對所述分段語音數(shù)據(jù)進(jìn)行句子級別的特征提取,得到第一特征;對所述第一特征進(jìn)行聚類,得到聚類結(jié)果;對所述分段語音數(shù)據(jù)中的語言內(nèi)容進(jìn)行識別,得到識別結(jié)果;根據(jù)所述聚類結(jié)果、所述識別結(jié)果,生成所述待分析音視頻數(shù)據(jù)的摘要結(jié)果。解決了現(xiàn)有的音視頻數(shù)據(jù)的摘要生成方法,效率較低的技術(shù)問題。