大數(shù)據(jù)知識挖掘及精準(zhǔn)跟蹤方法與系統(tǒng)

基本信息

申請?zhí)?/td> CN201710470156.X 申請日 -
公開(公告)號 CN108228687A 公開(公告)日 2018-06-29
申請公布號 CN108228687A 申請公布日 2018-06-29
分類號 G06F17/30;G06F17/27;G06K9/62 分類 計算;推算;計數(shù);
發(fā)明人 劉志陽;王玲;孫喆;楊趙磊;毛婷婷;李江龍 申請(專利權(quán))人 上海吉貝克信息技術(shù)有限公司
代理機構(gòu) 上海光華專利事務(wù)所(普通合伙) 代理人 上海吉貝克信息技術(shù)有限公司
地址 200093 上海市楊浦區(qū)控江七村61號172幢237室
法律狀態(tài) -

摘要

摘要 本發(fā)明的大數(shù)據(jù)知識挖掘及精準(zhǔn)跟蹤方法與系統(tǒng),通過判斷是否已有正確分類的訓(xùn)練語料從而區(qū)分監(jiān)督分類和非監(jiān)督分類,對應(yīng)監(jiān)督分類進(jìn)行第一處理,包括根據(jù)預(yù)處理的訓(xùn)練樣本提取特征,并生成特征向量,從而訓(xùn)練分類器來對待分類樣本進(jìn)行分類;或者,對應(yīng)非監(jiān)督分類采用對待分類樣本進(jìn)行預(yù)處理及特征提取,并生成特征向量,然后進(jìn)行特征向量間相似度運算,再通過聚類算法完成對待分類樣本的分類;使用多種分類算法的嵌套來實現(xiàn)多層級的多分類問題,同時需要將交互的關(guān)鍵詞加入到特征集合中,并根據(jù)相應(yīng)的算法賦予一定的特征權(quán)重將其應(yīng)用到分類算法中,最終提高自動分類的準(zhǔn)確性。