基于關(guān)鍵字的字符序列分割方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201110265973.4 申請(qǐng)日 -
公開(公告)號(hào) CN102819524B 公開(公告)日 2015-06-03
申請(qǐng)公布號(hào) CN102819524B 申請(qǐng)公布日 2015-06-03
分類號(hào) G06F17/27(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陽榮 申請(qǐng)(專利權(quán))人 北京金蝶云基科技有限公司
代理機(jī)構(gòu) 深圳市世紀(jì)恒程知識(shí)產(chǎn)權(quán)代理事務(wù)所 代理人 胡海國
地址 102400 北京市房山區(qū)良鄉(xiāng)凱旋大街建設(shè)路18號(hào)-C1065
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于關(guān)鍵字的字符序列分割方法及裝置,其方法包括:加載關(guān)鍵字,并建立關(guān)鍵字列表;根據(jù)關(guān)鍵字列表中關(guān)鍵字屬性的優(yōu)先級(jí)對(duì)關(guān)鍵字進(jìn)行排序;依據(jù)排序結(jié)果,以關(guān)鍵字為最小分割單位,通過預(yù)定的分詞算法對(duì)字符序列進(jìn)行分割。本發(fā)明通過定義關(guān)鍵字的優(yōu)先級(jí),建立關(guān)鍵字列表,以關(guān)鍵字列表中各關(guān)鍵字的優(yōu)先級(jí)排列順序,同時(shí)以關(guān)鍵字為最小分割單位,按照預(yù)定的分詞算法對(duì)字符序列進(jìn)行分割,提高了分詞準(zhǔn)確率及新詞識(shí)別能力,避免了分詞歧義,可以滿足公式、函數(shù)校驗(yàn)、解析等對(duì)分詞要求嚴(yán)格的應(yīng)用場景。