一種營運(yùn)車輛多模式跨界大數(shù)據(jù)的多層次深度融合挖掘方法
基本信息
申請(qǐng)?zhí)?/td> | CN202010850491.4 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN111984707A | 公開(公告)日 | 2020-11-24 |
申請(qǐng)公布號(hào) | CN111984707A | 申請(qǐng)公布日 | 2020-11-24 |
分類號(hào) | G06F16/2458(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 劉朝;王東強(qiáng);謝晶晶;孫英剛;歐燕林;夏揚(yáng);吳成軍;申東陽;李國勇 | 申請(qǐng)(專利權(quán))人 | 重慶大數(shù)據(jù)研究院有限公司 |
代理機(jī)構(gòu) | 重慶信航知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 穆祥維 |
地址 | 401147重慶市渝北區(qū)北部新區(qū)楊柳路2號(hào)綜合研發(fā)樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種營運(yùn)車輛多模式跨界大數(shù)據(jù)的多層次深度融合挖掘方法,包括如下步驟;S1、收集車輛多模式跨界大數(shù)據(jù)的原始數(shù)據(jù)集;S2、對(duì)收集到的所述原始數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理;S3、對(duì)預(yù)處理后的數(shù)據(jù)利用WEKA算法進(jìn)行數(shù)據(jù)挖掘提取出特征關(guān)鍵字;S4、通過TF?IDF技術(shù)計(jì)算出特征關(guān)鍵字權(quán)重和不同特征關(guān)鍵字之間的相似度,構(gòu)建權(quán)重和相似度矩陣;S5、基于樣本構(gòu)建回歸模型。本發(fā)明通過t?SNE降維、WEKA算法特征提取和TF?IDF算法,針對(duì)高維數(shù)據(jù)采取先降維再提取特征的分析策略,不僅實(shí)現(xiàn)了跨界大數(shù)據(jù)多層次深度融合挖掘的有效融合,解決了由數(shù)據(jù)類型復(fù)雜、數(shù)據(jù)特征眾多的高維數(shù)據(jù)集造成的融合效率低下和工作效率沒有顯著提高的問題。?? |
