一種基于大數(shù)據(jù)的降維轉(zhuǎn)換方法、電子設(shè)備、存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN201710994847.X | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN108009195A | 公開(kāi)(公告)日 | 2018-05-08 |
申請(qǐng)公布號(hào) | CN108009195A | 申請(qǐng)公布日 | 2018-05-08 |
分類(lèi)號(hào) | G06F17/30 | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 寧永春;房萍萍 | 申請(qǐng)(專(zhuān)利權(quán))人 | 環(huán)亞數(shù)據(jù)技術(shù)有限公司 |
代理機(jī)構(gòu) | 廣州市越秀區(qū)哲力專(zhuān)利商標(biāo)事務(wù)所(普通合伙) | 代理人 | 胡擁軍;趙賽 |
地址 | 215000 江蘇省蘇州市吳中區(qū)蘇蠡路81號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種基于大數(shù)據(jù)的降維轉(zhuǎn)換方法,包括步驟數(shù)據(jù)分類(lèi)、數(shù)據(jù)抽取、數(shù)據(jù)重組、建立數(shù)據(jù)降維索引。本發(fā)明根據(jù)業(yè)務(wù)選擇屬性建立不同的閾值范圍,降低多表屬性數(shù)據(jù)拼接的時(shí)間,尤其適用于業(yè)務(wù)關(guān)系復(fù)雜的數(shù)據(jù)記錄之間,同時(shí),數(shù)據(jù)記錄簇集的選擇和設(shè)置也具有針對(duì)性,保證用戶(hù)關(guān)注點(diǎn)更高的屬性列值被優(yōu)先進(jìn)行處理,提高列值處理的效率。本發(fā)明還通過(guò)數(shù)據(jù)反饋,通過(guò)對(duì)閾值和簇集的調(diào)整,優(yōu)化數(shù)據(jù)處理的效率,提高數(shù)據(jù)結(jié)構(gòu)的合理性。 |
