一種音視頻數(shù)據(jù)的摘要生成方法、裝置、設(shè)備和存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202111124453.1 | 申請日 | - |
公開(公告)號 | CN113891177A | 公開(公告)日 | 2022-01-04 |
申請公布號 | CN113891177A | 申請公布日 | 2022-01-04 |
分類號 | H04N21/8549(2011.01)I;H04N21/233(2011.01)I;H04N21/439(2011.01)I;G10L15/04(2013.01)I;G10L15/14(2006.01)I;G10L15/16(2006.01)I;G10L15/06(2013.01)I | 分類 | 電通信技術(shù); |
發(fā)明人 | 徐波 | 申請(專利權(quán))人 | 廣州多益網(wǎng)絡(luò)股份有限公司 |
代理機(jī)構(gòu) | 北京集佳知識產(chǎn)權(quán)代理有限公司 | 代理人 | 許慶勝 |
地址 | 510000廣東省廣州市蘿崗區(qū)伴河路90號自編一棟305房 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了一種音視頻數(shù)據(jù)的摘要生成方法、裝置、設(shè)備和存儲介質(zhì),其中方法包括:獲取待分析音視頻數(shù)據(jù)中的語音幀數(shù)據(jù);對所述語音幀數(shù)據(jù)進(jìn)行說話人變化的分段,得到若干分段語音數(shù)據(jù);對所述分段語音數(shù)據(jù)進(jìn)行句子級別的特征提取,得到第一特征;對所述第一特征進(jìn)行聚類,得到聚類結(jié)果;對所述分段語音數(shù)據(jù)中的語言內(nèi)容進(jìn)行識別,得到識別結(jié)果;根據(jù)所述聚類結(jié)果、所述識別結(jié)果,生成所述待分析音視頻數(shù)據(jù)的摘要結(jié)果。解決了現(xiàn)有的音視頻數(shù)據(jù)的摘要生成方法,效率較低的技術(shù)問題。 |
