一種基于自我學(xué)習(xí)算法的數(shù)據(jù)標(biāo)注方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201910237084.3 申請(qǐng)日 -
公開(公告)號(hào) CN109830230A 公開(公告)日 2019-05-31
申請(qǐng)公布號(hào) CN109830230A 申請(qǐng)公布日 2019-05-31
分類號(hào) G10L15/06(2013.01)I; G06F17/27(2006.01)I 分類 樂器;聲學(xué);
發(fā)明人 余偉; 趙靜芝; 任麗; 胡發(fā)澤; 徐旭東 申請(qǐng)(專利權(quán))人 深圳平安綜合金融服務(wù)有限公司上海分公司
代理機(jī)構(gòu) 上海專利商標(biāo)事務(wù)所有限公司 代理人 深圳平安綜合金融服務(wù)有限公司上海分公司
地址 200040 上海市靜安區(qū)常熟路8號(hào)靜安廣場(chǎng)8幢裙房4層L單元
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及語音信號(hào)處理領(lǐng)域,更具體的說,涉及一種基于自我學(xué)習(xí)算法的數(shù)據(jù)標(biāo)注方法及裝置。該方法包括:語音識(shí)別步驟;文本對(duì)比步驟,將多篇識(shí)別文本進(jìn)行對(duì)比,標(biāo)注差異部分文本,并進(jìn)行斷句處理;自然語言處理算法評(píng)價(jià)步驟;自然語言處理算法預(yù)測(cè)步驟;數(shù)據(jù)標(biāo)注步驟,參考差異部分原始識(shí)別文本與預(yù)測(cè)文本,對(duì)最優(yōu)預(yù)標(biāo)注文本進(jìn)行多次數(shù)據(jù)標(biāo)注,形成多組數(shù)據(jù)標(biāo)注文本;質(zhì)檢步驟;自我學(xué)習(xí)步驟,將最優(yōu)標(biāo)注文本與對(duì)應(yīng)音頻信號(hào)輸入語音識(shí)別引擎,語音識(shí)別引擎基于自我學(xué)習(xí)算法迭代訓(xùn)練語音識(shí)別。本發(fā)明方法及裝置,大大節(jié)省了數(shù)據(jù)標(biāo)注時(shí)長(zhǎng),有效提升了數(shù)據(jù)標(biāo)注質(zhì)量和數(shù)據(jù)標(biāo)注效率,為各類人工智能產(chǎn)品提供訓(xùn)練支持,提升智能產(chǎn)品生產(chǎn)效果。