一種基于數(shù)據(jù)支持的應(yīng)用系統(tǒng)構(gòu)建方法及裝置

基本信息

申請?zhí)?/td> CN201510347762.3 申請日 -
公開(公告)號 CN106326246B 公開(公告)日 2019-11-12
申請公布號 CN106326246B 申請公布日 2019-11-12
分類號 G06F16/35(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張浩; 陸軍; 蔣宏飛 申請(專利權(quán))人 阿里巴巴(北京)軟件服務(wù)有限公司
代理機(jī)構(gòu) 北京三友知識產(chǎn)權(quán)代理有限公司 代理人 李輝
地址 北京市朝陽區(qū)望京東園四區(qū)9號樓3層301號
法律狀態(tài) -

摘要

摘要 本申請涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種基于數(shù)據(jù)支持的應(yīng)用系統(tǒng)構(gòu)建方法及裝置,用以解決當(dāng)用于構(gòu)建應(yīng)用系統(tǒng)的數(shù)據(jù)的規(guī)模較大時(shí),會增加系統(tǒng)資源的占用,降低應(yīng)用系統(tǒng)的構(gòu)建效率的問題。本申請實(shí)施例提供的應(yīng)用系統(tǒng)構(gòu)建方法包括:根據(jù)用于構(gòu)建應(yīng)用系統(tǒng)的文本數(shù)據(jù)中各樣本點(diǎn)的屬性信息,將文本數(shù)據(jù)劃分為多個(gè)樣本點(diǎn)集合;針對每一個(gè)樣本點(diǎn)集合,從該樣本點(diǎn)集合中選取最少數(shù)目的樣本點(diǎn),使該最少數(shù)目的樣本點(diǎn)的詞序列覆蓋率高于設(shè)定閾值;采用選取的每一個(gè)樣本點(diǎn)集合中的樣本點(diǎn)構(gòu)建應(yīng)用系統(tǒng)。采用本申請實(shí)施例,可以從大規(guī)模海量數(shù)據(jù)中精選出對應(yīng)用系統(tǒng)具有價(jià)值的小部分?jǐn)?shù)據(jù)來構(gòu)建應(yīng)用系統(tǒng),從而減少占用的系統(tǒng)資源,提高應(yīng)用系統(tǒng)構(gòu)建效率。