一種語音識(shí)別文本的質(zhì)量提升方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN201910739528.3 申請(qǐng)日 -
公開(公告)號(hào) CN112447172A 公開(公告)日 2021-03-05
申請(qǐng)公布號(hào) CN112447172A 申請(qǐng)公布日 2021-03-05
分類號(hào) G10L15/06(2013.01)I;G10L15/26(2006.01)I;G06F40/211(2020.01)I;G06N3/04(2006.01)I;G10L15/22(2006.01)I;G10L25/30(2013.01)I 分類 樂器;聲學(xué);
發(fā)明人 葛懿;趙維崢;鄭黎;吳澤 申請(qǐng)(專利權(quán))人 云號(hào)(北京)科技有限公司
代理機(jī)構(gòu) 北京德琦知識(shí)產(chǎn)權(quán)代理有限公司 代理人 張馳;宋志強(qiáng)
地址 100088北京市西城區(qū)新街口外大街28號(hào)院C座C208
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施方式公開了一種語音識(shí)別文本的質(zhì)量提升方法和裝置。該方法包括:獲取語音識(shí)別文本,將所述語音識(shí)別文本平行輸入N?gram檢錯(cuò)模型和長(zhǎng)短期記憶(LSTM)檢錯(cuò)模型;使能N?gram檢錯(cuò)模型對(duì)所述語音識(shí)別文本檢錯(cuò)以確定第一錯(cuò)誤詞語,使能LSTM檢錯(cuò)模型對(duì)所述語音識(shí)別文本檢錯(cuò)以確定第二錯(cuò)誤詞語;融合N?gram檢錯(cuò)模型輸出的第一錯(cuò)誤詞語和LSTM檢錯(cuò)模型輸出的第二錯(cuò)誤詞語,以獲取融合后錯(cuò)誤詞語;基于依存句法分析方式對(duì)所述融合后錯(cuò)誤詞語執(zhí)行糾錯(cuò)。引入了上下文信息,擴(kuò)展了檢錯(cuò)范圍,提高了檢錯(cuò)精度。??