一種語種識別模型構建方法、語種識別方法

基本信息

申請?zhí)?/td> CN202110770019.4 申請日 -
公開(公告)號 CN113488023A 公開(公告)日 2021-10-08
申請公布號 CN113488023A 申請公布日 2021-10-08
分類號 G10L15/00(2013.01)I;G10L15/06(2013.01)I 分類 樂器;聲學;
發(fā)明人 楊軍;方磊 申請(專利權)人 合肥訊飛數(shù)碼科技有限公司
代理機構 北京集佳知識產(chǎn)權代理有限公司 代理人 郭化雨
地址 230088安徽省合肥市高新區(qū)望江西路666號人工智能云服務平臺研發(fā)樓
法律狀態(tài) -

摘要

摘要 本申請公開了一種語種識別模型構建方法、語種識別方法,先利用第一樣本語音及其實際語種、第二樣本語音,針對待訓練教師模型和待訓練學生模型進行兩階段訓練,得到待使用教師模型和待使用學生模型,以使該待使用教師模型和該待使用學生模型均具有較好的語種識別性能;再根據(jù)該待使用學生模型確定語種識別模型,以使該語種識別模型也具有較好的語種識別性能;最后,借助該語種識別模型針對待識別語音進行語種識別,得到該待識別語音的預測語種。其中,因無標簽訓練數(shù)據(jù)能夠彌補帶標簽訓練數(shù)據(jù)中數(shù)據(jù)分布失衡的缺陷,使得基于帶標簽訓練數(shù)據(jù)和無標簽訓練數(shù)據(jù)進行構建的語種識別模型具有較好的語種識別性能,如此能夠提高語種識別準確性。