一種動態(tài)輿情關鍵詞抽取系統(tǒng)和方法

基本信息

申請?zhí)?/td> CN201210586409.7 申請日 -
公開(公告)號 CN103186662B 公開(公告)日 2016-08-03
申請公布號 CN103186662B 申請公布日 2016-08-03
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 楊小豹;趙樹合 申請(專利權)人 北京中油網(wǎng)資訊技術有限公司
代理機構 北京元中知識產(chǎn)權代理有限責任公司 代理人 北京中油網(wǎng)資訊技術有限公司
地址 100011 北京市朝陽區(qū)安華里二區(qū)甲3號中國石油報社院內1號樓607
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種動態(tài)輿情關鍵詞抽取系統(tǒng)及方法,包括抽取模塊,映射模塊,分詞空間K3,計算模塊,標記模塊,抽取模塊以用戶輸入的關鍵詞進行目標信息的樣本抽取,映射模塊將抽取目標信息的文本信息映射到分詞空間K3中進行分詞處理,計算模塊將分詞處理后的中文詞匯表達為向量,根據(jù)中文詞匯的權重系數(shù)以及詞頻對中文詞匯進行權重指數(shù)的計算,選取出標簽關鍵詞傳送至標記模塊,進行信息的標簽關鍵詞標記,并生成一索引文件,能夠快速準確的生成標簽關鍵詞,進行目標信息的統(tǒng)計和標記,并生成方便用戶查詢的索引文件,用戶可以進行后續(xù)信息的查詢,只需要輸入標簽關鍵詞便能夠進行目標信息的快速查詢。