分詞處理方法及全文檢索方法
基本信息
申請?zhí)?/td> | CN200910083775.9 | 申請日 | - |
公開(公告)號 | CN101561818B | 公開(公告)日 | 2011-12-07 |
申請公布號 | CN101561818B | 申請公布日 | 2011-12-07 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 劉哲 | 申請(專利權(quán))人 | 北京偉庫電子商務(wù)科技有限公司 |
代理機(jī)構(gòu) | 北京友聯(lián)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 北京偉庫電子商務(wù)科技有限公司;用友網(wǎng)絡(luò)科技股份有限公司 |
地址 | 100094 北京市海淀區(qū)北清路68號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種分詞處理方法及其在數(shù)據(jù)庫全文檢索中的一種應(yīng)用,包括:創(chuàng)建基于數(shù)據(jù)庫特征項的新分詞系統(tǒng),并將所述數(shù)據(jù)庫特征項添加到所述新分詞系統(tǒng)中;以及將用戶提交的查詢詞以所述數(shù)據(jù)庫特征項作為詞表進(jìn)行分詞處理以生成分詞結(jié)果集。根據(jù)本發(fā)明提出的方法選定數(shù)據(jù)庫中字段作為特征項進(jìn)行分詞,利用了數(shù)據(jù)庫特征項與數(shù)據(jù)庫內(nèi)文本的關(guān)聯(lián)關(guān)系,有效地改善了一元、二元、預(yù)置詞表等傳統(tǒng)分詞方法的分詞準(zhǔn)確度。 |
