一種基于智能標引的文件語音化處理方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN201010204207.2 申請日 -
公開(公告)號 CN102280104A 公開(公告)日 2011-12-14
申請公布號 CN102280104A 申請公布日 2011-12-14
分類號 G10L13/08(2006.01)I 分類 樂器;聲學(xué);
發(fā)明人 鄧姿;王長橋;張軍;李松峰 申請(專利權(quán))人 北京文房飛閱傳媒技術(shù)有限公司
代理機構(gòu) 北京天昊聯(lián)合知識產(chǎn)權(quán)代理有限公司 代理人 陳源;羅建民
地址 100871 北京市海淀區(qū)成府路298號中關(guān)村方正大廈5層
法律狀態(tài) -

摘要

摘要 本發(fā)明提供基于智能標引的文件語音化處理方法,包括:對從數(shù)字文件中提取的原始文字塊和圖片塊進行標引,以合并文字塊、標定文字塊的內(nèi)容屬性、關(guān)聯(lián)圖片塊與圖說文字塊和構(gòu)建文章;建立描述不同文章之間和/或同一文章中的文本內(nèi)容之間的數(shù)據(jù)關(guān)系、圖片塊與圖說文字塊的關(guān)聯(lián)關(guān)系和/或圖片信息及閱讀順序的文本信息列表;將文本信息列表中的信息傳入語音庫中生成語音記錄文件或產(chǎn)品或者進行語音朗讀。相應(yīng)地,提供文件語音化處理系統(tǒng)。本發(fā)明實現(xiàn)了不同文本塊的不同語音化方式以及語音化過程中的段落跳轉(zhuǎn),增加了語音化的靈活性和多樣性,提高了閱讀的趣味性,而且,用戶可預(yù)制閱讀順序和語音庫參數(shù),使用靈活性高。