一種聲音與文本全自動(dòng)匹配對(duì)齊的方法
基本信息
申請(qǐng)?zhí)?/td> | CN201510238262.6 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN104900233A | 公開(kāi)(公告)日 | 2015-09-09 |
申請(qǐng)公布號(hào) | CN104900233A | 申請(qǐng)公布日 | 2015-09-09 |
分類號(hào) | G10L15/26(2006.01)I;G10L25/48(2013.01)I | 分類 | 樂(lè)器;聲學(xué); |
發(fā)明人 | 常鍇;羅振坤 | 申請(qǐng)(專利權(quán))人 | 深圳億幕信息科技有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 518000 廣東省深圳市南山區(qū)前海深港合作區(qū)深港青年夢(mèng)工場(chǎng)創(chuàng)業(yè)園A座5棟102室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實(shí)例涉及一種聲音與文本全自動(dòng)匹配對(duì)齊的方法,特別是涉及一種音視頻內(nèi)的聲音與講稿、聲音與字幕等文本內(nèi)容全自動(dòng)匹配及時(shí)間軸對(duì)齊的方法。本發(fā)明實(shí)例提供了一種能全自動(dòng)、標(biāo)準(zhǔn)化、無(wú)需人工干預(yù)的聲音與文本匹配對(duì)齊的方法。本發(fā)明實(shí)例采用音軌自動(dòng)剝離、音軌邏輯分割和大語(yǔ)音識(shí)別領(lǐng)域等技術(shù),在確保不破壞原始音視頻內(nèi)容的情況下,可高效、智能、準(zhǔn)確地幫助用戶批量實(shí)現(xiàn)音視頻內(nèi)容的實(shí)時(shí)音文匹配對(duì)齊并根據(jù)用戶需求輸出多種格式的時(shí)間軸碼文件。 |
