一種以矩陣計(jì)算為基礎(chǔ)進(jìn)行輿論信息抽取的方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN201510569894.0 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN105117385B | 公開(公告)日 | 2017-12-19 |
申請(qǐng)公布號(hào) | CN105117385B | 申請(qǐng)公布日 | 2017-12-19 |
分類號(hào) | G06F17/27(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 杜登斌;杜璞 | 申請(qǐng)(專利權(quán))人 | 北京中潤(rùn)普達(dá)信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京律誠(chéng)同業(yè)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 北京中潤(rùn)普達(dá)信息技術(shù)有限公司 |
地址 | 100029 北京市西城區(qū)北三環(huán)中路甲29號(hào)華尊大廈605 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提出一種以矩陣計(jì)算為基礎(chǔ)進(jìn)行輿論信息抽取的方法及系統(tǒng),該方法包括:抓取互聯(lián)網(wǎng)的網(wǎng)站信息,建立信息源矩陣,其中信息源矩陣包括信息庫類型信息、信息庫信息、站點(diǎn)信息、子站點(diǎn)信息、信息源統(tǒng)計(jì)信息、信息庫權(quán)限信息、基礎(chǔ)屬性信息、文章字段信息八部分;建立分詞矩陣、規(guī)則矩陣,分別獲取所述信息源矩陣與所述分詞矩陣與所述規(guī)則矩陣的權(quán)重與候選級(jí)別,用戶輸入用戶關(guān)鍵詞,通過分詞矩陣選擇所述用戶關(guān)鍵詞的所屬行業(yè),根據(jù)所述權(quán)重與所述候選級(jí)別計(jì)算綜合評(píng)分,以完成輿情分析。本發(fā)明無需建立情感詞庫,實(shí)時(shí)多維度抓取數(shù)據(jù),建立信息源矩陣、分詞矩陣、規(guī)則矩陣,三個(gè)矩陣進(jìn)行關(guān)聯(lián)達(dá)到動(dòng)態(tài)平衡,精確查找用戶查詢的詞,準(zhǔn)確率95%以上。 |
