音頻翻譯多語言文字處理方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN201610647853.3 申請日 -
公開(公告)號 CN106303695A 公開(公告)日 2017-01-04
申請公布號 CN106303695A 申請公布日 2017-01-04
分類號 H04N21/4402(2011.01)I;H04N21/488(2011.01)I;H04N21/439(2011.01)I;G06F17/28(2006.01)I 分類 電通信技術(shù);
發(fā)明人 馬士華 申請(專利權(quán))人 北京東方嘉禾文化發(fā)展股份有限公司
代理機構(gòu) 北京潤文專利代理事務(wù)所(普通合伙) 代理人 丁繼恩
地址 100007 北京市東城區(qū)藏經(jīng)館胡同17號嘉城印象B區(qū)3層
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種音頻翻譯為多語言文字處理方法和系統(tǒng),包括如下步驟:分析語音音頻文件,根據(jù)用戶語音的強弱程度產(chǎn)生多個波形文件;根據(jù)每個波形文件的波形特征確定多個語音的開始和結(jié)束,生成多個第一格式化處理結(jié)果,得到多個第一語音音頻段;對每個第一語音音頻段利用語音識別軟件進行語音到文字的轉(zhuǎn)換,并生成多個第二格式化的處理結(jié)果,得到多個第一語音音頻段對應(yīng)的多個原始文字文件;將第一格式處理結(jié)果、原始文字文件根據(jù)序列號進行合并,得到相應(yīng)的音頻的字幕文件。其實現(xiàn)快速大量甚至批量自動化地生成字幕。