視頻記錄文稿生成方法、裝置、存儲介質(zhì)以及電子設(shè)備

基本信息

申請?zhí)?/td> CN202110511724.2 申請日 -
公開(公告)號 CN113450773A 公開(公告)日 2021-09-28
申請公布號 CN113450773A 申請公布日 2021-09-28
分類號 G10L15/04(2013.01)I;G10L15/06(2013.01)I;G10L15/26(2006.01)I 分類 樂器;聲學(xué);
發(fā)明人 徐波 申請(專利權(quán))人 廣東利為網(wǎng)絡(luò)科技有限公司
代理機(jī)構(gòu) 廣州駿思知識產(chǎn)權(quán)代理有限公司 代理人 潘桂生
地址 510530廣東省廣州市蘿崗區(qū)伴河路90號自編一棟305房
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種視頻記錄文稿生成方法、裝置、存儲介質(zhì)以及電子設(shè)備,該方法包括:獲取視頻文件,從視頻文件中分離出音頻文件,將音頻文件進(jìn)行分割,得到多個(gè)音頻片段,將每個(gè)音頻片段輸入至語音轉(zhuǎn)向量模型,獲得多個(gè)音頻向量,將多個(gè)所述音頻向量進(jìn)行聚類,獲得多個(gè)聚類簇,將包含音頻向量個(gè)數(shù)最多的聚類簇確定為中心聚類簇,計(jì)算其他聚類簇的中心到中心聚類簇中心的相對距離,根據(jù)相對距離以及預(yù)設(shè)的顏色漸變表中每種顏色與相對距離的映射關(guān)系,確定每個(gè)聚類簇對應(yīng)的顏色,將每個(gè)聚類簇對應(yīng)的音頻片段進(jìn)行語音識別,生成音頻片段對應(yīng)的音頻文字,給所述音頻文字上色,生成視頻記錄文稿,提高了查找信息的效率,降低了人工成本。