一種基于緩存語言模型的語音識別自適應方法和系統(tǒng)
基本信息
申請?zhí)?/td> | CN202011332443.2 | 申請日 | - |
公開(公告)號 | CN112509560B | 公開(公告)日 | 2021-09-03 |
申請公布號 | CN112509560B | 申請公布日 | 2021-09-03 |
分類號 | G10L15/04;G10L15/183;G10L15/26 | 分類 | 樂器;聲學; |
發(fā)明人 | 黃俊杰 | 申請(專利權)人 | 杭州一知智能科技有限公司 |
代理機構 | 杭州求是專利事務所有限公司 | 代理人 | 鄭海峰 |
地址 | 311200 浙江省杭州市蕭山區(qū)啟迪路198號杭州灣信息港F座7樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于緩存語言模型的語音識別自適應方法和系統(tǒng),屬于語音識別領域。本發(fā)明通過接收用戶輸入的持續(xù)語音信號,基于語音活動檢測技術VAD將持續(xù)語音信號切分為多個短語音,基于通用語言模型對短語音依次進行識別,并為每個短語音生成對應的識別結果,基于關鍵詞搜索得到關聯(lián)詞表,通過緩存模型對關聯(lián)詞表進行處理,得到適應歷史識別文本分布的局部變化的語言模型,基于修改后的語言模型對后續(xù)短語音繼續(xù)識別。經(jīng)過局部修改后,語言模型和歷史識別內容具有更好的相似性,提升了持續(xù)長語音的識別的準確率。另外,用戶可以在識別的過程中對錯誤識別的低頻詞進行主動修正,提升后續(xù)對低頻詞的識別準確率。 |
