一種基于自我學(xué)習(xí)算法的數(shù)據(jù)標(biāo)注方法及裝置

基本信息

申請?zhí)?/td> CN201910237084.3 申請日 -
公開(公告)號 CN109830230B 公開(公告)日 2019-05-31
申請公布號 CN109830230B 申請公布日 2019-05-31
分類號 G10L15/06(2013.01)I 分類 -
發(fā)明人 余偉;趙靜芝;任麗;胡發(fā)澤;徐旭東 申請(專利權(quán))人 深圳平安綜合金融服務(wù)有限公司上海分公司
代理機(jī)構(gòu) 上海專利商標(biāo)事務(wù)所有限公司 代理人 深圳平安綜合金融服務(wù)有限公司上海分公司
地址 200040上海市靜安區(qū)常熟路8號靜安廣場8幢裙房4層L單元
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及語音信號處理領(lǐng)域,更具體的說,涉及一種基于自我學(xué)習(xí)算法的數(shù)據(jù)標(biāo)注方法及裝置。該方法包括:語音識別步驟;文本對比步驟,將多篇識別文本進(jìn)行對比,標(biāo)注差異部分文本,并進(jìn)行斷句處理;自然語言處理算法評價步驟;自然語言處理算法預(yù)測步驟;數(shù)據(jù)標(biāo)注步驟,參考差異部分原始識別文本與預(yù)測文本,對最優(yōu)預(yù)標(biāo)注文本進(jìn)行多次數(shù)據(jù)標(biāo)注,形成多組數(shù)據(jù)標(biāo)注文本;質(zhì)檢步驟;自我學(xué)習(xí)步驟,將最優(yōu)標(biāo)注文本與對應(yīng)音頻信號輸入語音識別引擎,語音識別引擎基于自我學(xué)習(xí)算法迭代訓(xùn)練語音識別。本發(fā)明方法及裝置,大大節(jié)省了數(shù)據(jù)標(biāo)注時長,有效提升了數(shù)據(jù)標(biāo)注質(zhì)量和數(shù)據(jù)標(biāo)注效率,為各類人工智能產(chǎn)品提供訓(xùn)練支持,提升智能產(chǎn)品生產(chǎn)效果。??