語(yǔ)音數(shù)據(jù)標(biāo)注方法及電子設(shè)備、存儲(chǔ)裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202110158767.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113160800A | 公開(公告)日 | 2021-07-23 |
申請(qǐng)公布號(hào) | CN113160800A | 申請(qǐng)公布日 | 2021-07-23 |
分類號(hào) | G10L15/06;G10L15/18 | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 艾坤;陳志剛;梅林海;劉權(quán);王智國(guó);胡國(guó)平 | 申請(qǐng)(專利權(quán))人 | 吉林科訊信息科技有限公司 |
代理機(jī)構(gòu) | 深圳市威世博知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 李申 |
地址 | 130000 吉林省長(zhǎng)春市朝陽(yáng)區(qū)前進(jìn)大街996號(hào)力旺廣場(chǎng)B座16樓1632室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開了語(yǔ)音數(shù)據(jù)標(biāo)注方法及電子設(shè)備、存儲(chǔ)裝置,該方法包括:獲取第一語(yǔ)音數(shù)據(jù)中的高混淆度數(shù)據(jù),高混淆度數(shù)據(jù)為混淆度值超過閾值的數(shù)據(jù);提取高混淆度數(shù)據(jù)的語(yǔ)義特征,并獲取與語(yǔ)義特征接近的多個(gè)近似數(shù)據(jù);利用第一意圖分類模型對(duì)近似數(shù)據(jù)進(jìn)行預(yù)測(cè),以獲得近似數(shù)據(jù)的意圖分類結(jié)果;將高混淆度數(shù)據(jù)所標(biāo)注的意圖修正為近似數(shù)據(jù)的意圖分類結(jié)果中占比達(dá)到預(yù)設(shè)比值的意圖,以得到修正后的第一語(yǔ)音數(shù)據(jù);利用修正后的第一語(yǔ)音數(shù)據(jù)對(duì)第一意圖分類模型進(jìn)行訓(xùn)練,以獲得第二意圖分類模型;利用第二意圖分類模型對(duì)第二語(yǔ)音數(shù)據(jù)進(jìn)行預(yù)測(cè),以獲得第二語(yǔ)音數(shù)據(jù)對(duì)應(yīng)的意圖分類結(jié)果。上述方案,能夠?qū)崿F(xiàn)語(yǔ)音數(shù)據(jù)進(jìn)行意圖標(biāo)注的標(biāo)準(zhǔn)化,提高標(biāo)注的準(zhǔn)確率。 |
