一種基于自我學(xué)習(xí)算法的數(shù)據(jù)標(biāo)注方法及裝置
基本信息
申請?zhí)?/td> | CN201910237084.3 | 申請日 | - |
公開(公告)號 | CN109830230B | 公開(公告)日 | 2019-05-31 |
申請公布號 | CN109830230B | 申請公布日 | 2019-05-31 |
分類號 | G10L15/06(2013.01)I | 分類 | - |
發(fā)明人 | 余偉;趙靜芝;任麗;胡發(fā)澤;徐旭東 | 申請(專利權(quán))人 | 深圳平安綜合金融服務(wù)有限公司上海分公司 |
代理機(jī)構(gòu) | 上海專利商標(biāo)事務(wù)所有限公司 | 代理人 | 深圳平安綜合金融服務(wù)有限公司上海分公司 |
地址 | 200040上海市靜安區(qū)常熟路8號靜安廣場8幢裙房4層L單元 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及語音信號處理領(lǐng)域,更具體的說,涉及一種基于自我學(xué)習(xí)算法的數(shù)據(jù)標(biāo)注方法及裝置。該方法包括:語音識別步驟;文本對比步驟,將多篇識別文本進(jìn)行對比,標(biāo)注差異部分文本,并進(jìn)行斷句處理;自然語言處理算法評價步驟;自然語言處理算法預(yù)測步驟;數(shù)據(jù)標(biāo)注步驟,參考差異部分原始識別文本與預(yù)測文本,對最優(yōu)預(yù)標(biāo)注文本進(jìn)行多次數(shù)據(jù)標(biāo)注,形成多組數(shù)據(jù)標(biāo)注文本;質(zhì)檢步驟;自我學(xué)習(xí)步驟,將最優(yōu)標(biāo)注文本與對應(yīng)音頻信號輸入語音識別引擎,語音識別引擎基于自我學(xué)習(xí)算法迭代訓(xùn)練語音識別。本發(fā)明方法及裝置,大大節(jié)省了數(shù)據(jù)標(biāo)注時長,有效提升了數(shù)據(jù)標(biāo)注質(zhì)量和數(shù)據(jù)標(biāo)注效率,為各類人工智能產(chǎn)品提供訓(xùn)練支持,提升智能產(chǎn)品生產(chǎn)效果。?? |
