基于雙向上下文的非自回歸語(yǔ)音識(shí)別網(wǎng)絡(luò)、方法及設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN202111066812.2 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113516973A | 公開(公告)日 | 2021-10-19 |
申請(qǐng)公布號(hào) | CN113516973A | 申請(qǐng)公布日 | 2021-10-19 |
分類號(hào) | G10L15/08(2006.01)I;G10L15/06(2013.01)I;G10L15/183(2013.01)I | 分類 | 樂器;聲學(xué); |
發(fā)明人 | 不公告發(fā)明人 | 申請(qǐng)(專利權(quán))人 | 珠海億智電子科技有限公司 |
代理機(jī)構(gòu) | 深圳青年人專利商標(biāo)代理有限公司 | 代理人 | 吳桂華 |
地址 | 519000廣東省珠海市高新區(qū)唐家灣鎮(zhèn)港樂路8號(hào)大洲科技園B區(qū)廠房803室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明適用于人類語(yǔ)言處理技術(shù)領(lǐng)域,提供了一種基于雙向上下文的非自回歸語(yǔ)音識(shí)別網(wǎng)絡(luò)、方法、設(shè)備及存儲(chǔ)介質(zhì),本發(fā)明提供的語(yǔ)音識(shí)別網(wǎng)絡(luò)采用Transformer的編碼器?解碼器結(jié)構(gòu),語(yǔ)音識(shí)別網(wǎng)絡(luò)的編碼器用于對(duì)輸入的語(yǔ)音特征進(jìn)行初步識(shí)別,得到初步識(shí)別結(jié)果,語(yǔ)音識(shí)別網(wǎng)絡(luò)的解碼器用于利用由初步識(shí)別結(jié)果提供的雙向語(yǔ)言信息對(duì)初步識(shí)別結(jié)果進(jìn)行調(diào)整,并輸出最終的語(yǔ)音識(shí)別結(jié)果,其中,解碼器通過預(yù)設(shè)的、應(yīng)用于解碼器的每個(gè)多頭自注意力層的注意力掩碼利用雙向語(yǔ)言信息,從而充分了利用了語(yǔ)言信息,提高了語(yǔ)音識(shí)別效果,且相較于使用兩個(gè)單向解碼器分別利用單向語(yǔ)言信息的方法,結(jié)構(gòu)更加高效統(tǒng)一。 |
