語音語料庫的構(gòu)建方法和系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201310116396.1 申請(qǐng)日 -
公開(公告)號(hào) CN103198828B 公開(公告)日 2015-09-23
申請(qǐng)公布號(hào) CN103198828B 申請(qǐng)公布日 2015-09-23
分類號(hào) G10L15/06(2013.01)I;G10L15/30(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 江南;陳德全 申請(qǐng)(專利權(quán))人 中金數(shù)據(jù)集團(tuán)有限公司
代理機(jī)構(gòu) 北京三聚陽光知識(shí)產(chǎn)權(quán)代理有限公司 代理人 寇海俠
地址 100176 北京市大興區(qū)北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)博興八路1號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明的語音語料庫的構(gòu)建方法和系統(tǒng),通過語音錄入客戶端實(shí)現(xiàn)語音語料的采集,進(jìn)而通過網(wǎng)絡(luò)傳輸給服務(wù)器,使得語音語料的采集可以隨時(shí)隨地進(jìn)行,無需專門的錄音棚和專門的錄音設(shè)備,借用現(xiàn)有的網(wǎng)絡(luò)即可實(shí)現(xiàn),語音語料的獲取成本大大降低;同時(shí),語音語料是用于后續(xù)語音識(shí)別的,識(shí)別的語音均在平時(shí)的生活環(huán)境中生成,要識(shí)別的錄音自然會(huì)有周圍環(huán)境的噪音,如果語音語料僅在錄音棚中生成,反而脫離了實(shí)際生活,不利于實(shí)際生活場(chǎng)景中語音的識(shí)別。本發(fā)明的語音語料庫的構(gòu)建方法和系統(tǒng),在減少成本的基礎(chǔ)上,更使得語音語料更接近實(shí)際場(chǎng)景中的語音,提高實(shí)際場(chǎng)景中語音的識(shí)別率。