一種基于高拍儀獲得語音播放方法和系統(tǒng)

基本信息

申請?zhí)?/td> 2020109967792 申請日 -
公開(公告)號 CN112259074A 公開(公告)日 2021-01-22
申請公布號 CN112259074A 申請公布日 2021-01-22
分類號 G10L13/04(2013.01)I; 分類 樂器;聲學(xué);
發(fā)明人 范國強(qiáng);郭長青 申請(專利權(quán))人 北京麥哲科技有限公司
代理機(jī)構(gòu) 北京力量專利代理事務(wù)所(特殊普通合伙) 代理人 姚遠(yuǎn)方
地址 100094北京市海淀區(qū)東北旺中關(guān)村軟件園信息中心三層B306
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于高拍儀獲得語音播放方法,包括:步驟一,掃描預(yù)定圖片,生成掃描圖片;步驟二,通過OCR技術(shù)識別所述掃描圖片預(yù)定區(qū)域的文字,生成識別文字;步驟三,通過TTS技術(shù)將所述識別文字轉(zhuǎn)換成語音文件。通過先將預(yù)定的圖片進(jìn)行拍攝掃描,生存掃描圖片,然后將掃描圖片上預(yù)定區(qū)域的文字通過OCR技術(shù)進(jìn)行識別,生成識別文字,識別文字可以為可編輯的文字,然后通過TTS技術(shù)將識別文字轉(zhuǎn)換成語音文件,從而實現(xiàn)從圖片到語音文件(MP3或WAV)的直接輸出,提高拍攝儀等設(shè)備可以直接輸出成語音文件的能力,提高使用便利性。??