一種聲音與文本全自動(dòng)匹配對(duì)齊的方法

基本信息

申請(qǐng)?zhí)?/td> CN201510238262.6 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN104900233A 公開(kāi)(公告)日 2015-09-09
申請(qǐng)公布號(hào) CN104900233A 申請(qǐng)公布日 2015-09-09
分類號(hào) G10L15/26(2006.01)I;G10L25/48(2013.01)I 分類 樂(lè)器;聲學(xué);
發(fā)明人 常鍇;羅振坤 申請(qǐng)(專利權(quán))人 深圳億幕信息科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 518000 廣東省深圳市南山區(qū)前海深港合作區(qū)深港青年夢(mèng)工場(chǎng)創(chuàng)業(yè)園A座5棟102室
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)例涉及一種聲音與文本全自動(dòng)匹配對(duì)齊的方法,特別是涉及一種音視頻內(nèi)的聲音與講稿、聲音與字幕等文本內(nèi)容全自動(dòng)匹配及時(shí)間軸對(duì)齊的方法。本發(fā)明實(shí)例提供了一種能全自動(dòng)、標(biāo)準(zhǔn)化、無(wú)需人工干預(yù)的聲音與文本匹配對(duì)齊的方法。本發(fā)明實(shí)例采用音軌自動(dòng)剝離、音軌邏輯分割和大語(yǔ)音識(shí)別領(lǐng)域等技術(shù),在確保不破壞原始音視頻內(nèi)容的情況下,可高效、智能、準(zhǔn)確地幫助用戶批量實(shí)現(xiàn)音視頻內(nèi)容的實(shí)時(shí)音文匹配對(duì)齊并根據(jù)用戶需求輸出多種格式的時(shí)間軸碼文件。