一種拼音糾錯(cuò)方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201310268072.X 申請日 -
公開(公告)號(hào) CN104252484B 公開(公告)日 2018-10-19
申請公布號(hào) CN104252484B 申請公布日 2018-10-19
分類號(hào) G06F17/30 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 熊小鵬;劉磊 申請(專利權(quán))人 重慶新媒農(nóng)信科技有限公司
代理機(jī)構(gòu) 重慶市前沿專利事務(wù)所(普通合伙) 代理人 重慶新媒農(nóng)信科技有限公司
地址 401121 重慶市北部新區(qū)高新園黃山大道5號(hào)水星科技大廈南翼寫字樓1樓3號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提出了一種拼音糾錯(cuò)方法及系統(tǒng),該拼音糾錯(cuò)方法包括如下步驟:構(gòu)建詞庫,將用戶可能檢索的所有拼音串及其反轉(zhuǎn)字符串分別組織并存儲(chǔ)于正向、反向兩棵三叉搜索樹中;分析和檢測用戶輸入的檢索串,判斷其是否可拆分為若干音節(jié)串,獲取檢索串的錯(cuò)誤類型,所述錯(cuò)誤類型分為合法錯(cuò)誤和非法錯(cuò)誤;對(duì)合法錯(cuò)誤檢索串進(jìn)行合法糾錯(cuò),對(duì)非法錯(cuò)誤檢索串進(jìn)行非法糾錯(cuò),采用正向、反向兩棵三叉搜索樹的查詢操作獲取糾錯(cuò)結(jié)果;計(jì)算糾錯(cuò)結(jié)果中的所有拼音串與用戶輸入的檢索串的相似度,獲取相似度最大的K個(gè)拼音串并輸出。本發(fā)明的拼音糾錯(cuò)方算法設(shè)計(jì)簡潔、高效,糾錯(cuò)速度快,準(zhǔn)確率高。