一種領域特征詞的提取方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN201310211467.6 | 申請日 | - |
公開(公告)號 | CN103258053B | 公開(公告)日 | 2018-01-26 |
申請公布號 | CN103258053B | 申請公布日 | 2018-01-26 |
分類號 | G06F17/30 | 分類 | 計算;推算;計數; |
發(fā)明人 | 車天文;雷大偉;石志偉;周步戀;楊振東;王喜民 | 申請(專利權)人 | 深圳宜搜天下科技股份有限公司 |
代理機構 | 深圳市凱達知識產權事務所 | 代理人 | 深圳市宜搜科技發(fā)展有限公司;深圳宜搜天下科技股份有限公司 |
地址 | 518026 廣東省深圳市福田區(qū)濱河路與彩田路交匯處聯(lián)合廣場A棟塔樓A5501-A | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及信息檢索領域,提供了一種領域特征詞的提取方法,包括,獲取領域實體資源;獲取領域實體的搜索結果;利用所述搜索結果提取候選領域特征詞;根據所述候選領域特征詞,篩選出領域特征詞。本發(fā)明還提供了一種領域特征詞的提取系統(tǒng)。采用本發(fā)明的技術方案,考慮了領域實體專業(yè)詞與特征詞的關系,采用通過領域專業(yè)詞借助搜索引擎來提取領域特征詞,既不需要在人工規(guī)則上花費很大精力投入,過程中只需要一些明顯的規(guī)則、領域特征詞做后續(xù)分析用;又避免了靠統(tǒng)計而沒有大量優(yōu)質的統(tǒng)計語料問題。該方案從實際出發(fā),簡單易行,效率高,可快速周期性更新,來提取應用于實際。 |
