一種基于云平臺的海量數(shù)據(jù)關聯(lián)管理方法及裝置
基本信息
申請?zhí)?/td> | CN202011586684.X | 申請日 | - |
公開(公告)號 | CN112632357A | 公開(公告)日 | 2021-04-09 |
申請公布號 | CN112632357A | 申請公布日 | 2021-04-09 |
分類號 | G06F16/951;G06F40/216 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王緒生;衛(wèi)才智;鄒巍;盧利祥;俞俊;劉乾超 | 申請(專利權)人 | 中金數(shù)據(jù)(武漢)超算技術有限公司 |
代理機構 | 武漢紅觀專利代理事務所(普通合伙) | 代理人 | 陳凱 |
地址 | 430000 湖北省武漢市東西湖區(qū)徑河街道十字東街7號(10) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提出了一種基于云平臺的海量數(shù)據(jù)關聯(lián)管理方法及裝置。包括:獲取數(shù)據(jù)記錄,根據(jù)該數(shù)據(jù)記錄獲取記錄關聯(lián)數(shù)據(jù);建立TF?IDF算法,根據(jù)該TF?IDF算法從數(shù)據(jù)記錄中提取對應的記錄關鍵詞,根據(jù)該記錄關鍵詞爬取對應的爬取關聯(lián)詞語;將記錄關聯(lián)數(shù)據(jù)與爬取關聯(lián)詞語進行比較,根據(jù)比較結果,得到最終關聯(lián)數(shù)據(jù);對數(shù)據(jù)記錄以及最終關聯(lián)數(shù)據(jù)進行關聯(lián)標記,并進行管理。本發(fā)明通過從數(shù)據(jù)記錄中提取記錄關聯(lián)數(shù)據(jù),然后通過TF?IDF算法得到爬取關聯(lián)詞語,然后通過記錄關聯(lián)數(shù)據(jù)與爬取關聯(lián)詞語得到最終關聯(lián)數(shù)據(jù),并對數(shù)據(jù)記錄以及最終關聯(lián)數(shù)據(jù)進行管理,能夠有效提高數(shù)據(jù)關聯(lián)管理的效率以及準確度。 |
