一種基于緩存語言模型的語音識別自適應方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN202011332443.2 申請日 -
公開(公告)號 CN112509560B 公開(公告)日 2021-09-03
申請公布號 CN112509560B 申請公布日 2021-09-03
分類號 G10L15/04;G10L15/183;G10L15/26 分類 樂器;聲學;
發(fā)明人 黃俊杰 申請(專利權)人 杭州一知智能科技有限公司
代理機構 杭州求是專利事務所有限公司 代理人 鄭海峰
地址 311200 浙江省杭州市蕭山區(qū)啟迪路198號杭州灣信息港F座7樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于緩存語言模型的語音識別自適應方法和系統(tǒng),屬于語音識別領域。本發(fā)明通過接收用戶輸入的持續(xù)語音信號,基于語音活動檢測技術VAD將持續(xù)語音信號切分為多個短語音,基于通用語言模型對短語音依次進行識別,并為每個短語音生成對應的識別結果,基于關鍵詞搜索得到關聯(lián)詞表,通過緩存模型對關聯(lián)詞表進行處理,得到適應歷史識別文本分布的局部變化的語言模型,基于修改后的語言模型對后續(xù)短語音繼續(xù)識別。經(jīng)過局部修改后,語言模型和歷史識別內容具有更好的相似性,提升了持續(xù)長語音的識別的準確率。另外,用戶可以在識別的過程中對錯誤識別的低頻詞進行主動修正,提升后續(xù)對低頻詞的識別準確率。