用音頻特征主成分建立的語音群集來識別說話人的方法
基本信息
申請?zhí)?/td> | CN201811118265.6 | 申請日 | - |
公開(公告)號 | CN109065059A | 公開(公告)日 | 2018-12-21 |
申請公布號 | CN109065059A | 申請公布日 | 2018-12-21 |
分類號 | G10L17/08;G10L17/04;G10L17/02 | 分類 | 樂器;聲學; |
發(fā)明人 | 陳永清;陳東風;王貴珊;李瑞娟 | 申請(專利權(quán))人 | 新巴特(安徽)智能科技有限公司 |
代理機構(gòu) | - | 代理人 | - |
地址 | 239000 安徽省滁州市世紀大道801號昭陽工業(yè)園10號廠房 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種用音頻特征主成分建立的語音群集來識別說話人的方法,該方法是將主成分分析和基于音頻特征在主分量空間中的歐幾里得距離的層次聚類相結(jié)合,具體為:收集不同的訓練音頻樣本集;計算每個樣本的時域和頻域音頻特征;計算出時域和頻域音頻特征的平均值和標準偏差;通過計算出的數(shù)據(jù)對訓練樣本進行主成分分析;將每個音頻由音頻特征數(shù)據(jù)沿著上述N個主成分投影的坐標來代表;采用UPGMA聚類分析算法,基于n維空間中的距離對說話人進行聚類。本發(fā)明的方法具有速度快,添加新說話人語音方便的特點,用于智能語言教學系統(tǒng),實現(xiàn)了說話人識別,從未知的多個發(fā)言者會話中及時分辨說話人,利于針對性的教學。 |
