用音頻特征主成分建立的語(yǔ)音群集來(lái)識(shí)別說(shuō)話人的方法

基本信息

申請(qǐng)?zhí)?/td> CN201811118265.6 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN109065059A 公開(kāi)(公告)日 2018-12-21
申請(qǐng)公布號(hào) CN109065059A 申請(qǐng)公布日 2018-12-21
分類號(hào) G10L17/08;G10L17/04;G10L17/02 分類 樂(lè)器;聲學(xué);
發(fā)明人 陳永清;陳東風(fēng);王貴珊;李瑞娟 申請(qǐng)(專利權(quán))人 新巴特(安徽)智能科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 239000 安徽省滁州市世紀(jì)大道801號(hào)昭陽(yáng)工業(yè)園10號(hào)廠房
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種用音頻特征主成分建立的語(yǔ)音群集來(lái)識(shí)別說(shuō)話人的方法,該方法是將主成分分析和基于音頻特征在主分量空間中的歐幾里得距離的層次聚類相結(jié)合,具體為:收集不同的訓(xùn)練音頻樣本集;計(jì)算每個(gè)樣本的時(shí)域和頻域音頻特征;計(jì)算出時(shí)域和頻域音頻特征的平均值和標(biāo)準(zhǔn)偏差;通過(guò)計(jì)算出的數(shù)據(jù)對(duì)訓(xùn)練樣本進(jìn)行主成分分析;將每個(gè)音頻由音頻特征數(shù)據(jù)沿著上述N個(gè)主成分投影的坐標(biāo)來(lái)代表;采用UPGMA聚類分析算法,基于n維空間中的距離對(duì)說(shuō)話人進(jìn)行聚類。本發(fā)明的方法具有速度快,添加新說(shuō)話人語(yǔ)音方便的特點(diǎn),用于智能語(yǔ)言教學(xué)系統(tǒng),實(shí)現(xiàn)了說(shuō)話人識(shí)別,從未知的多個(gè)發(fā)言者會(huì)話中及時(shí)分辨說(shuō)話人,利于針對(duì)性的教學(xué)。