一種語(yǔ)音識(shí)別文本的質(zhì)量提升方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN201910739528.3 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112447172A 公開(kāi)(公告)日 2021-03-05
申請(qǐng)公布號(hào) CN112447172A 申請(qǐng)公布日 2021-03-05
分類(lèi)號(hào) G10L15/06(2013.01)I;G10L15/26(2006.01)I;G06F40/211(2020.01)I;G06N3/04(2006.01)I;G10L15/22(2006.01)I;G10L25/30(2013.01)I 分類(lèi) 樂(lè)器;聲學(xué);
發(fā)明人 葛懿;趙維崢;鄭黎;吳澤 申請(qǐng)(專(zhuān)利權(quán))人 云號(hào)(北京)科技有限公司
代理機(jī)構(gòu) 北京德琦知識(shí)產(chǎn)權(quán)代理有限公司 代理人 張馳;宋志強(qiáng)
地址 100088北京市西城區(qū)新街口外大街28號(hào)院C座C208
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施方式公開(kāi)了一種語(yǔ)音識(shí)別文本的質(zhì)量提升方法和裝置。該方法包括:獲取語(yǔ)音識(shí)別文本,將所述語(yǔ)音識(shí)別文本平行輸入N?gram檢錯(cuò)模型和長(zhǎng)短期記憶(LSTM)檢錯(cuò)模型;使能N?gram檢錯(cuò)模型對(duì)所述語(yǔ)音識(shí)別文本檢錯(cuò)以確定第一錯(cuò)誤詞語(yǔ),使能LSTM檢錯(cuò)模型對(duì)所述語(yǔ)音識(shí)別文本檢錯(cuò)以確定第二錯(cuò)誤詞語(yǔ);融合N?gram檢錯(cuò)模型輸出的第一錯(cuò)誤詞語(yǔ)和LSTM檢錯(cuò)模型輸出的第二錯(cuò)誤詞語(yǔ),以獲取融合后錯(cuò)誤詞語(yǔ);基于依存句法分析方式對(duì)所述融合后錯(cuò)誤詞語(yǔ)執(zhí)行糾錯(cuò)。引入了上下文信息,擴(kuò)展了檢錯(cuò)范圍,提高了檢錯(cuò)精度。??