一種領域特征詞的提取方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201310211467.6 申請日 -
公開(公告)號 CN103258053B 公開(公告)日 2018-01-26
申請公布號 CN103258053B 申請公布日 2018-01-26
分類號 G06F17/30 分類 計算;推算;計數;
發(fā)明人 車天文;雷大偉;石志偉;周步戀;楊振東;王喜民 申請(專利權)人 深圳宜搜天下科技股份有限公司
代理機構 深圳市凱達知識產權事務所 代理人 深圳市宜搜科技發(fā)展有限公司;深圳宜搜天下科技股份有限公司
地址 518026 廣東省深圳市福田區(qū)濱河路與彩田路交匯處聯(lián)合廣場A棟塔樓A5501-A
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及信息檢索領域,提供了一種領域特征詞的提取方法,包括,獲取領域實體資源;獲取領域實體的搜索結果;利用所述搜索結果提取候選領域特征詞;根據所述候選領域特征詞,篩選出領域特征詞。本發(fā)明還提供了一種領域特征詞的提取系統(tǒng)。采用本發(fā)明的技術方案,考慮了領域實體專業(yè)詞與特征詞的關系,采用通過領域專業(yè)詞借助搜索引擎來提取領域特征詞,既不需要在人工規(guī)則上花費很大精力投入,過程中只需要一些明顯的規(guī)則、領域特征詞做后續(xù)分析用;又避免了靠統(tǒng)計而沒有大量優(yōu)質的統(tǒng)計語料問題。該方案從實際出發(fā),簡單易行,效率高,可快速周期性更新,來提取應用于實際。