一種以矩陣計算為基礎進行輿論信息抽取的方法及系統

基本信息

申請?zhí)?/td> CN201510569894.0 申請日 -
公開(公告)號 CN105117385A 公開(公告)日 2015-12-02
申請公布號 CN105117385A 申請公布日 2015-12-02
分類號 G06F17/27(2006.01)I 分類 計算;推算;計數;
發(fā)明人 杜登斌;杜璞 申請(專利權)人 北京中潤普達信息技術有限公司
代理機構 北京律誠同業(yè)知識產權代理有限公司 代理人 北京中潤普達信息技術有限公司
地址 100029 北京市西城區(qū)北三環(huán)中路甲29號華尊大廈605
法律狀態(tài) -

摘要

摘要 本發(fā)明提出一種以矩陣計算為基礎進行輿論信息抽取的方法及系統,該方法包括:抓取互聯網的網站信息,建立信息源矩陣,其中信息源矩陣包括信息庫類型信息、信息庫信息、站點信息、子站點信息、信息源統計信息、信息庫權限信息、基礎屬性信息、文章字段信息八部分;建立分詞矩陣、規(guī)則矩陣,分別獲取所述信息源矩陣與所述分詞矩陣與所述規(guī)則矩陣的權重與候選級別,用戶輸入用戶關鍵詞,通過分詞矩陣選擇所述用戶關鍵詞的所屬行業(yè),根據所述權重與所述候選級別計算綜合評分,以完成輿情分析。本發(fā)明無需建立情感詞庫,實時多維度抓取數據,建立信息源矩陣、分詞矩陣、規(guī)則矩陣,三個矩陣進行關聯達到動態(tài)平衡,精確查找用戶查詢的詞,準確率95%以上。