一種基于高拍儀獲得語音播放方法和系統(tǒng)
基本信息
申請?zhí)?/td> | 2020109967792 | 申請日 | - |
公開(公告)號 | CN112259074A | 公開(公告)日 | 2021-01-22 |
申請公布號 | CN112259074A | 申請公布日 | 2021-01-22 |
分類號 | G10L13/04(2013.01)I; | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 范國強(qiáng);郭長青 | 申請(專利權(quán))人 | 北京麥哲科技有限公司 |
代理機(jī)構(gòu) | 北京力量專利代理事務(wù)所(特殊普通合伙) | 代理人 | 姚遠(yuǎn)方 |
地址 | 100094北京市海淀區(qū)東北旺中關(guān)村軟件園信息中心三層B306 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種基于高拍儀獲得語音播放方法,包括:步驟一,掃描預(yù)定圖片,生成掃描圖片;步驟二,通過OCR技術(shù)識別所述掃描圖片預(yù)定區(qū)域的文字,生成識別文字;步驟三,通過TTS技術(shù)將所述識別文字轉(zhuǎn)換成語音文件。通過先將預(yù)定的圖片進(jìn)行拍攝掃描,生存掃描圖片,然后將掃描圖片上預(yù)定區(qū)域的文字通過OCR技術(shù)進(jìn)行識別,生成識別文字,識別文字可以為可編輯的文字,然后通過TTS技術(shù)將識別文字轉(zhuǎn)換成語音文件,從而實現(xiàn)從圖片到語音文件(MP3或WAV)的直接輸出,提高拍攝儀等設(shè)備可以直接輸出成語音文件的能力,提高使用便利性。?? |
