視頻記錄文稿生成方法、裝置、存儲介質(zhì)以及電子設(shè)備
基本信息
申請?zhí)?/td> | CN202110511724.2 | 申請日 | - |
公開(公告)號 | CN113450773A | 公開(公告)日 | 2021-09-28 |
申請公布號 | CN113450773A | 申請公布日 | 2021-09-28 |
分類號 | G10L15/04(2013.01)I;G10L15/06(2013.01)I;G10L15/26(2006.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 徐波 | 申請(專利權(quán))人 | 廣東利為網(wǎng)絡(luò)科技有限公司 |
代理機(jī)構(gòu) | 廣州駿思知識產(chǎn)權(quán)代理有限公司 | 代理人 | 潘桂生 |
地址 | 510530廣東省廣州市蘿崗區(qū)伴河路90號自編一棟305房 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種視頻記錄文稿生成方法、裝置、存儲介質(zhì)以及電子設(shè)備,該方法包括:獲取視頻文件,從視頻文件中分離出音頻文件,將音頻文件進(jìn)行分割,得到多個(gè)音頻片段,將每個(gè)音頻片段輸入至語音轉(zhuǎn)向量模型,獲得多個(gè)音頻向量,將多個(gè)所述音頻向量進(jìn)行聚類,獲得多個(gè)聚類簇,將包含音頻向量個(gè)數(shù)最多的聚類簇確定為中心聚類簇,計(jì)算其他聚類簇的中心到中心聚類簇中心的相對距離,根據(jù)相對距離以及預(yù)設(shè)的顏色漸變表中每種顏色與相對距離的映射關(guān)系,確定每個(gè)聚類簇對應(yīng)的顏色,將每個(gè)聚類簇對應(yīng)的音頻片段進(jìn)行語音識別,生成音頻片段對應(yīng)的音頻文字,給所述音頻文字上色,生成視頻記錄文稿,提高了查找信息的效率,降低了人工成本。 |
