一種基于云平臺的海量數(shù)據(jù)關聯(lián)管理方法及裝置

基本信息

申請?zhí)?/td> CN202011586684.X 申請日 -
公開(公告)號 CN112632357A 公開(公告)日 2021-04-09
申請公布號 CN112632357A 申請公布日 2021-04-09
分類號 G06F16/951;G06F40/216 分類 計算;推算;計數(shù);
發(fā)明人 王緒生;衛(wèi)才智;鄒巍;盧利祥;俞俊;劉乾超 申請(專利權)人 中金數(shù)據(jù)(武漢)超算技術有限公司
代理機構 武漢紅觀專利代理事務所(普通合伙) 代理人 陳凱
地址 430000 湖北省武漢市東西湖區(qū)徑河街道十字東街7號(10)
法律狀態(tài) -

摘要

摘要 本發(fā)明提出了一種基于云平臺的海量數(shù)據(jù)關聯(lián)管理方法及裝置。包括:獲取數(shù)據(jù)記錄,根據(jù)該數(shù)據(jù)記錄獲取記錄關聯(lián)數(shù)據(jù);建立TF?IDF算法,根據(jù)該TF?IDF算法從數(shù)據(jù)記錄中提取對應的記錄關鍵詞,根據(jù)該記錄關鍵詞爬取對應的爬取關聯(lián)詞語;將記錄關聯(lián)數(shù)據(jù)與爬取關聯(lián)詞語進行比較,根據(jù)比較結果,得到最終關聯(lián)數(shù)據(jù);對數(shù)據(jù)記錄以及最終關聯(lián)數(shù)據(jù)進行關聯(lián)標記,并進行管理。本發(fā)明通過從數(shù)據(jù)記錄中提取記錄關聯(lián)數(shù)據(jù),然后通過TF?IDF算法得到爬取關聯(lián)詞語,然后通過記錄關聯(lián)數(shù)據(jù)與爬取關聯(lián)詞語得到最終關聯(lián)數(shù)據(jù),并對數(shù)據(jù)記錄以及最終關聯(lián)數(shù)據(jù)進行管理,能夠有效提高數(shù)據(jù)關聯(lián)管理的效率以及準確度。