基于關鍵字的字符序列分割方法及裝置
基本信息
申請?zhí)?/td> | CN201110265973.4 | 申請日 | - |
公開(公告)號 | CN102819524A | 公開(公告)日 | 2012-12-12 |
申請公布號 | CN102819524A | 申請公布日 | 2012-12-12 |
分類號 | G06F17/27(2006.01)I | 分類 | 計算;推算;計數; |
發(fā)明人 | 陽榮 | 申請(專利權)人 | 北京金蝶云基科技有限公司 |
代理機構 | 深圳市世紀恒程知識產權代理事務所 | 代理人 | 胡海國 |
地址 | 102400 北京市房山區(qū)良鄉(xiāng)凱旋大街建設路18號-C1065 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于關鍵字的字符序列分割方法及裝置,其方法包括:加載關鍵字,并建立關鍵字列表;根據關鍵字列表中關鍵字屬性的優(yōu)先級對關鍵字進行排序;依據排序結果,以關鍵字為最小分割單位,通過預定的分詞算法對字符序列進行分割。本發(fā)明通過定義關鍵字的優(yōu)先級,建立關鍵字列表,以關鍵字列表中各關鍵字的優(yōu)先級排列順序,同時以關鍵字為最小分割單位,按照預定的分詞算法對字符序列進行分割,提高了分詞準確率及新詞識別能力,避免了分詞歧義,可以滿足公式、函數校驗、解析等對分詞要求嚴格的應用場景。 |
