一種動態(tài)輿情關鍵詞抽取系統(tǒng)和方法
基本信息
申請?zhí)?/td> | CN201210586409.7 | 申請日 | - |
公開(公告)號 | CN103186662B | 公開(公告)日 | 2016-08-03 |
申請公布號 | CN103186662B | 申請公布日 | 2016-08-03 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 楊小豹;趙樹合 | 申請(專利權)人 | 北京中油網(wǎng)資訊技術有限公司 |
代理機構 | 北京元中知識產(chǎn)權代理有限責任公司 | 代理人 | 北京中油網(wǎng)資訊技術有限公司 |
地址 | 100011 北京市朝陽區(qū)安華里二區(qū)甲3號中國石油報社院內1號樓607 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種動態(tài)輿情關鍵詞抽取系統(tǒng)及方法,包括抽取模塊,映射模塊,分詞空間K3,計算模塊,標記模塊,抽取模塊以用戶輸入的關鍵詞進行目標信息的樣本抽取,映射模塊將抽取目標信息的文本信息映射到分詞空間K3中進行分詞處理,計算模塊將分詞處理后的中文詞匯表達為向量,根據(jù)中文詞匯的權重系數(shù)以及詞頻對中文詞匯進行權重指數(shù)的計算,選取出標簽關鍵詞傳送至標記模塊,進行信息的標簽關鍵詞標記,并生成一索引文件,能夠快速準確的生成標簽關鍵詞,進行目標信息的統(tǒng)計和標記,并生成方便用戶查詢的索引文件,用戶可以進行后續(xù)信息的查詢,只需要輸入標簽關鍵詞便能夠進行目標信息的快速查詢。 |
