基于垂直領域的語音文本糾錯方法、系統(tǒng)、設備及介質
基本信息
申請?zhí)?/td> | CN201910466328.5 | 申請日 | - |
公開(公告)號 | CN110210029A | 公開(公告)日 | 2019-09-06 |
申請公布號 | CN110210029A | 申請公布日 | 2019-09-06 |
分類號 | G06F17/27(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 嵇望; 汪斌; 林達; 李斌 | 申請(專利權)人 | 浙江遠傳信息技術股份有限公司 |
代理機構 | 深圳市深聯(lián)知識產權代理事務所(普通合伙) | 代理人 | 浙江遠傳信息技術股份有限公司 |
地址 | 310051 浙江省杭州市濱江區(qū)信誠路857號世貿中心23樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明申請涉及自然語言處理領域,公開了一種基于垂直領域的語音文本糾錯方法,包括將語音轉譯為語音文本后基于領域詞典進行分詞,得到分詞結果;根據(jù)所述分詞結果生成混淆集;從所述混淆集中獲取糾錯候選句,使用語言模型對糾錯候選句進行評分,如果糾錯候選句評分不高于原句或不高于預定的閾值,則判定為沒有錯誤,否則得分最高的糾錯候選句即為糾錯結果。本專利還公開了一種基于垂直領域的語音文本糾錯系統(tǒng)、電子設備和計算機存儲介質。本專利根據(jù)專業(yè)領域建立分詞詞典,提升專業(yè)領域下的分詞結果,從而提升語音文本識別正確率,再結合語言模型對糾錯候選句做評分排序,以確定表達用戶真實的語音文本,能進一步提高語音交互的準確率。 |
