說話人識(shí)別網(wǎng)絡(luò)模型訓(xùn)練方法、說話人識(shí)別方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201810025592.0 申請(qǐng)日 -
公開(公告)號(hào) CN108417217B 公開(公告)日 2021-07-13
申請(qǐng)公布號(hào) CN108417217B 申請(qǐng)公布日 2021-07-13
分類號(hào) G10L17/04;G10L17/18 分類 樂器;聲學(xué);
發(fā)明人 錢彥旻;黃子礫;王帥 申請(qǐng)(專利權(quán))人 上海交大知識(shí)產(chǎn)權(quán)管理有限公司
代理機(jī)構(gòu) 北京商專永信知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 方挺;車江華
地址 215123 江蘇省蘇州市蘇州工業(yè)園區(qū)新平街388號(hào)騰飛創(chuàng)新園14棟
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種說話人識(shí)別網(wǎng)絡(luò)模型訓(xùn)練方法,包括:從訓(xùn)練數(shù)據(jù)集中獲取第i話語三元組并將第i話語三元組輸入至卷積神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)對(duì)第i話語三元組進(jìn)行特征提取得到第i話語特征三元組并輸入至線性神經(jīng)網(wǎng)絡(luò);將預(yù)先獲取的第一說話人的第一身份向量信息和第二說話人的第二身份向量信息輸入至線性神經(jīng)網(wǎng)絡(luò)進(jìn)行融合處理,以得到融合后的第i話語特征三元組;根據(jù)融合后的第i話語特征三元組計(jì)算三元組損失,以調(diào)整所述網(wǎng)絡(luò)模型。本發(fā)明實(shí)施例得到的說話人識(shí)別網(wǎng)絡(luò)模型能夠更加準(zhǔn)確的實(shí)現(xiàn)說話人的識(shí)別功能,具有最低的等錯(cuò)誤率。