一種視頻分割方法、系統(tǒng)、設(shè)備及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202011374280.4 申請日 -
公開(公告)號 CN112565885A 公開(公告)日 2021-03-26
申請公布號 CN112565885A 申請公布日 2021-03-26
分類號 G10L17/00(2013.01)I;G10L25/57(2013.01)I;G06K9/00(2006.01)I;G10L15/04(2013.01)I;G10L21/0208(2013.01)I;H04N21/44(2011.01)I;H04N21/234(2011.01)I;G10L15/26(2006.01)I;G10L17/18(2013.01)I;G10L15/02(2006.01)I;G10L15/16(2006.01)I;H04N21/233(2011.01)I;G10L25/30(2013.01)I;H04N21/439(2011.01)I;G10L17/04(2013.01)I 分類 電通信技術(shù);
發(fā)明人 胡玉針;葉俊杰;李權(quán);王倫基;李嘉雄;朱杰;成秋喜;黃桂芳;韓藍(lán)青 申請(專利權(quán))人 賽業(yè)(廣州)生物科技有限公司
代理機(jī)構(gòu) 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 代理人 尹凡華
地址 510530廣東省廣州市黃埔區(qū)香雪八路98號香雪國際公寓F棟
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種視頻分割方法、系統(tǒng)、設(shè)備及存儲介質(zhì),方法包括從第一視頻中提取第一音頻并去噪得到第二音頻;分析第二音頻獲得第三音頻和第一時間節(jié)點(diǎn)信息,并得到第一視頻片段;對第三音頻進(jìn)行人聲識別,得到第二視頻片段;對第二視頻片段進(jìn)行人臉檢測;對含人臉視頻片段進(jìn)行唇形同步檢測;對唇形同步視頻片段進(jìn)行語音增強(qiáng),進(jìn)一步對已有視頻片段進(jìn)行語音識別,得到語音識別結(jié)果。本發(fā)明通過對視頻采用諸如去噪、神經(jīng)網(wǎng)絡(luò)分析、人聲識別、人臉檢測、唇形同步檢測、語音增強(qiáng)結(jié)果等處理手段,能夠自動化實(shí)現(xiàn)對視頻的高精度切割。本發(fā)明可以廣泛應(yīng)用于視頻處理技術(shù)領(lǐng)域。??