混合語音的識(shí)別方法及裝置、存儲(chǔ)介質(zhì)、電子裝置

基本信息

申請?zhí)?/td> CN202110219826.7 申請日 -
公開(公告)號 CN113160804A 公開(公告)日 2021-07-23
申請公布號 CN113160804A 申請公布日 2021-07-23
分類號 G10L15/08(2006.01)I;G10L15/06(2013.01)I;G10L15/02(2006.01)I;G10L15/00(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 黃石磊;王昕;程剛 申請(專利權(quán))人 深圳市北科瑞訊信息技術(shù)有限公司
代理機(jī)構(gòu) 深圳智匯遠(yuǎn)見知識(shí)產(chǎn)權(quán)代理有限公司 代理人 李雪鵑;劉潔
地址 518000廣東省深圳市南山區(qū)高新區(qū)南區(qū)深港產(chǎn)學(xué)研基地大樓東座五樓E502-C室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種混合語音的識(shí)別方法及裝置、存儲(chǔ)介質(zhì)、電子裝置,其中,該方法包括:獲取待音素識(shí)別的混合語音,其中,所述混合語音包括中文單詞和英文單詞;從所述混合語音中提取英文非縮寫單詞;采用第一預(yù)設(shè)字素序列到音素序列G2P模型識(shí)別所述英文非縮寫單詞的第一音素信息,其中,所述第一預(yù)設(shè)G2P模型通過中文音素的解碼結(jié)果訓(xùn)練得到,包括英文單詞與中文音素之間的映射序列。通過本發(fā)明,在節(jié)省人工成本同時(shí)追求聲學(xué)上高度相似的映射標(biāo)注,實(shí)現(xiàn)了一種質(zhì)量可靠的英文發(fā)音方案。解決了相關(guān)技術(shù)中音素識(shí)別混合語音的效率低的技術(shù)問題。