說話人識別網(wǎng)絡(luò)模型訓練方法、說話人識別方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN201810025592.0 | 申請日 | - |
公開(公告)號 | CN108417217B | 公開(公告)日 | 2021-07-13 |
申請公布號 | CN108417217B | 申請公布日 | 2021-07-13 |
分類號 | G10L17/04;G10L17/18 | 分類 | 樂器;聲學; |
發(fā)明人 | 錢彥旻;黃子礫;王帥 | 申請(專利權(quán))人 | 上海交大知識產(chǎn)權(quán)管理有限公司 |
代理機構(gòu) | 北京商專永信知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 方挺;車江華 |
地址 | 215123 江蘇省蘇州市蘇州工業(yè)園區(qū)新平街388號騰飛創(chuàng)新園14棟 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開一種說話人識別網(wǎng)絡(luò)模型訓練方法,包括:從訓練數(shù)據(jù)集中獲取第i話語三元組并將第i話語三元組輸入至卷積神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)對第i話語三元組進行特征提取得到第i話語特征三元組并輸入至線性神經(jīng)網(wǎng)絡(luò);將預先獲取的第一說話人的第一身份向量信息和第二說話人的第二身份向量信息輸入至線性神經(jīng)網(wǎng)絡(luò)進行融合處理,以得到融合后的第i話語特征三元組;根據(jù)融合后的第i話語特征三元組計算三元組損失,以調(diào)整所述網(wǎng)絡(luò)模型。本發(fā)明實施例得到的說話人識別網(wǎng)絡(luò)模型能夠更加準確的實現(xiàn)說話人的識別功能,具有最低的等錯誤率。 |
