分詞處理方法及全文檢索方法

基本信息

申請?zhí)?/td> CN200910083775.9 申請日 -
公開(公告)號 CN101561818B 公開(公告)日 2011-12-07
申請公布號 CN101561818B 申請公布日 2011-12-07
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 劉哲 申請(專利權(quán))人 北京偉庫電子商務(wù)科技有限公司
代理機(jī)構(gòu) 北京友聯(lián)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 北京偉庫電子商務(wù)科技有限公司;用友網(wǎng)絡(luò)科技股份有限公司
地址 100094 北京市海淀區(qū)北清路68號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種分詞處理方法及其在數(shù)據(jù)庫全文檢索中的一種應(yīng)用,包括:創(chuàng)建基于數(shù)據(jù)庫特征項的新分詞系統(tǒng),并將所述數(shù)據(jù)庫特征項添加到所述新分詞系統(tǒng)中;以及將用戶提交的查詢詞以所述數(shù)據(jù)庫特征項作為詞表進(jìn)行分詞處理以生成分詞結(jié)果集。根據(jù)本發(fā)明提出的方法選定數(shù)據(jù)庫中字段作為特征項進(jìn)行分詞,利用了數(shù)據(jù)庫特征項與數(shù)據(jù)庫內(nèi)文本的關(guān)聯(lián)關(guān)系,有效地改善了一元、二元、預(yù)置詞表等傳統(tǒng)分詞方法的分詞準(zhǔn)確度。