混合語音的識(shí)別方法及裝置、存儲(chǔ)介質(zhì)、電子裝置
基本信息
申請?zhí)?/td> | CN202110219826.7 | 申請日 | - |
公開(公告)號 | CN113160804A | 公開(公告)日 | 2021-07-23 |
申請公布號 | CN113160804A | 申請公布日 | 2021-07-23 |
分類號 | G10L15/08(2006.01)I;G10L15/06(2013.01)I;G10L15/02(2006.01)I;G10L15/00(2013.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 黃石磊;王昕;程剛 | 申請(專利權(quán))人 | 深圳市北科瑞訊信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 深圳智匯遠(yuǎn)見知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 李雪鵑;劉潔 |
地址 | 518000廣東省深圳市南山區(qū)高新區(qū)南區(qū)深港產(chǎn)學(xué)研基地大樓東座五樓E502-C室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種混合語音的識(shí)別方法及裝置、存儲(chǔ)介質(zhì)、電子裝置,其中,該方法包括:獲取待音素識(shí)別的混合語音,其中,所述混合語音包括中文單詞和英文單詞;從所述混合語音中提取英文非縮寫單詞;采用第一預(yù)設(shè)字素序列到音素序列G2P模型識(shí)別所述英文非縮寫單詞的第一音素信息,其中,所述第一預(yù)設(shè)G2P模型通過中文音素的解碼結(jié)果訓(xùn)練得到,包括英文單詞與中文音素之間的映射序列。通過本發(fā)明,在節(jié)省人工成本同時(shí)追求聲學(xué)上高度相似的映射標(biāo)注,實(shí)現(xiàn)了一種質(zhì)量可靠的英文發(fā)音方案。解決了相關(guān)技術(shù)中音素識(shí)別混合語音的效率低的技術(shù)問題。 |
