一種領(lǐng)域特征詞的提取方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN201310211467.6 | 申請日 | - |
公開(公告)號 | CN103258053B | 公開(公告)日 | 2018-01-26 |
申請公布號 | CN103258053B | 申請公布日 | 2018-01-26 |
分類號 | G06F17/30 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 車天文;雷大偉;石志偉;周步戀;楊振東;王喜民 | 申請(專利權(quán))人 | 深圳宜搜天下科技股份有限公司 |
代理機構(gòu) | 深圳市凱達知識產(chǎn)權(quán)事務(wù)所 | 代理人 | 深圳市宜搜科技發(fā)展有限公司;深圳宜搜天下科技股份有限公司 |
地址 | 518026 廣東省深圳市福田區(qū)濱河路與彩田路交匯處聯(lián)合廣場A棟塔樓A5501-A | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及信息檢索領(lǐng)域,提供了一種領(lǐng)域特征詞的提取方法,包括,獲取領(lǐng)域?qū)嶓w資源;獲取領(lǐng)域?qū)嶓w的搜索結(jié)果;利用所述搜索結(jié)果提取候選領(lǐng)域特征詞;根據(jù)所述候選領(lǐng)域特征詞,篩選出領(lǐng)域特征詞。本發(fā)明還提供了一種領(lǐng)域特征詞的提取系統(tǒng)。采用本發(fā)明的技術(shù)方案,考慮了領(lǐng)域?qū)嶓w專業(yè)詞與特征詞的關(guān)系,采用通過領(lǐng)域?qū)I(yè)詞借助搜索引擎來提取領(lǐng)域特征詞,既不需要在人工規(guī)則上花費很大精力投入,過程中只需要一些明顯的規(guī)則、領(lǐng)域特征詞做后續(xù)分析用;又避免了靠統(tǒng)計而沒有大量優(yōu)質(zhì)的統(tǒng)計語料問題。該方案從實際出發(fā),簡單易行,效率高,可快速周期性更新,來提取應(yīng)用于實際。 |
