一種跨場景快速適應(yīng)的語音識別方法和裝置

基本信息

申請?zhí)?/td> CN202010305374.X 申請日 -
公開(公告)號 CN111477211A 公開(公告)日 2020-07-31
申請公布號 CN111477211A 申請公布日 2020-07-31
分類號 G10L15/02(2006.01)I 分類 -
發(fā)明人 李新宇 申請(專利權(quán))人 珠海聲原智能科技有限公司
代理機構(gòu) 北京匯彩知識產(chǎn)權(quán)代理有限公司 代理人 珠海聲原智能科技有限公司
地址 519000廣東省珠海市香洲區(qū)吉大景山路蓮山巷8號8樓A802單元
法律狀態(tài) -

摘要

摘要 本發(fā)明提出一種跨場景快速適應(yīng)的語音識別方法和裝置,通過通用數(shù)據(jù)在不同場景的真實錄放,真實大規(guī)模生成場景訓(xùn)練語音數(shù)據(jù),從而達(dá)到對場景的快速語音適應(yīng),具有快速、低成本和高效的優(yōu)勢,助力語音識別多場景的落地應(yīng)用。包括以下步驟:首先選取滿足要求的基礎(chǔ)語音;然后將選取的基礎(chǔ)語音在需要適應(yīng)的場景中進(jìn)行場景語音生成,通過高保真放音設(shè)備進(jìn)行基礎(chǔ)語音播放,用拾音設(shè)備進(jìn)行錄??;再對錄制的場景語音進(jìn)行標(biāo)注,通過基礎(chǔ)語音的標(biāo)注信息進(jìn)行場景錄制語音對齊,生成真實場景的場景標(biāo)注語音;最后采用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行場景語音自適應(yīng)訓(xùn)練,達(dá)到場景語音識別的要求。??