大數(shù)據(jù)知識挖掘及精準(zhǔn)跟蹤方法與系統(tǒng)
基本信息
申請?zhí)?/td> | CN201710470156.X | 申請日 | - |
公開(公告)號 | CN108228687A | 公開(公告)日 | 2018-06-29 |
申請公布號 | CN108228687A | 申請公布日 | 2018-06-29 |
分類號 | G06F17/30;G06F17/27;G06K9/62 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 劉志陽;王玲;孫喆;楊趙磊;毛婷婷;李江龍 | 申請(專利權(quán))人 | 上海吉貝克信息技術(shù)有限公司 |
代理機構(gòu) | 上海光華專利事務(wù)所(普通合伙) | 代理人 | 上海吉貝克信息技術(shù)有限公司 |
地址 | 200093 上海市楊浦區(qū)控江七村61號172幢237室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明的大數(shù)據(jù)知識挖掘及精準(zhǔn)跟蹤方法與系統(tǒng),通過判斷是否已有正確分類的訓(xùn)練語料從而區(qū)分監(jiān)督分類和非監(jiān)督分類,對應(yīng)監(jiān)督分類進(jìn)行第一處理,包括根據(jù)預(yù)處理的訓(xùn)練樣本提取特征,并生成特征向量,從而訓(xùn)練分類器來對待分類樣本進(jìn)行分類;或者,對應(yīng)非監(jiān)督分類采用對待分類樣本進(jìn)行預(yù)處理及特征提取,并生成特征向量,然后進(jìn)行特征向量間相似度運算,再通過聚類算法完成對待分類樣本的分類;使用多種分類算法的嵌套來實現(xiàn)多層級的多分類問題,同時需要將交互的關(guān)鍵詞加入到特征集合中,并根據(jù)相應(yīng)的算法賦予一定的特征權(quán)重將其應(yīng)用到分類算法中,最終提高自動分類的準(zhǔn)確性。 |
