基于關鍵字的字符序列分割方法及裝置

基本信息

申請?zhí)?/td> CN201110265973.4 申請日 -
公開(公告)號 CN102819524A 公開(公告)日 2012-12-12
申請公布號 CN102819524A 申請公布日 2012-12-12
分類號 G06F17/27(2006.01)I 分類 計算;推算;計數;
發(fā)明人 陽榮 申請(專利權)人 北京金蝶云基科技有限公司
代理機構 深圳市世紀恒程知識產權代理事務所 代理人 胡海國
地址 102400 北京市房山區(qū)良鄉(xiāng)凱旋大街建設路18號-C1065
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于關鍵字的字符序列分割方法及裝置,其方法包括:加載關鍵字,并建立關鍵字列表;根據關鍵字列表中關鍵字屬性的優(yōu)先級對關鍵字進行排序;依據排序結果,以關鍵字為最小分割單位,通過預定的分詞算法對字符序列進行分割。本發(fā)明通過定義關鍵字的優(yōu)先級,建立關鍵字列表,以關鍵字列表中各關鍵字的優(yōu)先級排列順序,同時以關鍵字為最小分割單位,按照預定的分詞算法對字符序列進行分割,提高了分詞準確率及新詞識別能力,避免了分詞歧義,可以滿足公式、函數校驗、解析等對分詞要求嚴格的應用場景。