一種基于深度學(xué)習(xí)的非結(jié)構(gòu)化數(shù)據(jù)處理方法
基本信息
申請(qǐng)?zhí)?/td> | CN201710044292.2 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN106844636A | 公開(kāi)(公告)日 | 2017-06-13 |
申請(qǐng)公布號(hào) | CN106844636A | 申請(qǐng)公布日 | 2017-06-13 |
分類(lèi)號(hào) | G06F17/30(2006.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 沙云飛;李晨放;趙雪晴;王天然;郝聞眾;丁浣;鄭培晨;宋力 | 申請(qǐng)(專(zhuān)利權(quán))人 | 常州倍源無(wú)限數(shù)據(jù)科技有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 213000 江蘇省常州市武進(jìn)區(qū)常武中路18—50號(hào)常州科教城創(chuàng)研港5—106 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種基于深度學(xué)習(xí)的非結(jié)構(gòu)化數(shù)據(jù)處理方法,屬于大數(shù)據(jù)處理技術(shù)領(lǐng)域,該基于深度學(xué)習(xí)的非結(jié)構(gòu)化數(shù)據(jù)處理方法,包括:1)非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ),基于Hadoop的大數(shù)據(jù)框架,解決非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)、管理、訪問(wèn);2)非結(jié)構(gòu)化數(shù)據(jù)的預(yù)處理,利用大數(shù)據(jù)平臺(tái)的ETL能力,完成數(shù)據(jù)預(yù)處理(清洗、轉(zhuǎn)換、挖掘、搜索);3)非結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)化處理,采用時(shí)空分割、特征提取、對(duì)象識(shí)別等處理手段,實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)向信息、情報(bào)的轉(zhuǎn)化;4)非結(jié)構(gòu)化數(shù)據(jù)的處理能力提升,利用深度學(xué)習(xí)算法來(lái)替代手工獲取特征分析。本發(fā)明可以實(shí)現(xiàn)海量非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ),支持非結(jié)構(gòu)化數(shù)據(jù)的批量、實(shí)時(shí)處理,增強(qiáng)非結(jié)構(gòu)化數(shù)據(jù)處理的效率、準(zhǔn)確性和合理性。 |
