一種表數(shù)據(jù)泛化方法及裝置

基本信息

申請?zhí)?/td> CN202210184206.9 申請日 -
公開(公告)號 CN114548303A 公開(公告)日 2022-05-27
申請公布號 CN114548303A 申請公布日 2022-05-27
分類號 G06K9/62(2022.01)I;G06F40/30(2020.01)I;G06F40/177(2020.01)I;G06F21/62(2013.01)I 分類 計算;推算;計數(shù);
發(fā)明人 張正欣;牟黎明;王豪;肖春亮;張宏;何坤 申請(專利權(quán))人 神州綠盟成都科技有限公司
代理機構(gòu) 北京同達信恒知識產(chǎn)權(quán)代理有限公司 代理人 -
地址 610015四川省成都市中國(四川)自由貿(mào)易試驗區(qū)成都高新區(qū)和樂二街150號C區(qū)5棟1層
法律狀態(tài) -

摘要

摘要 本申請公開了一種表數(shù)據(jù)泛化方法及裝置,用以提升表數(shù)據(jù)泛化的效率。該方法包括:確定待泛化的表中多個表數(shù)據(jù)分別包括的各類型的子數(shù)據(jù),其中子數(shù)據(jù)的類型包括數(shù)值型、包含語義的第一文本型以及不包含語義的第二文本型;根據(jù)任一表數(shù)據(jù)包括的各類型的子數(shù)據(jù)的距離參數(shù),確定其與各中心點的距離;其中數(shù)值型子數(shù)據(jù)與各中心點的數(shù)值型變量的相似程度為其距離參數(shù);第一文本型子數(shù)據(jù)與各中心點的第一文本型變量的相似程度為其距離參數(shù);第二文本型子數(shù)據(jù)的距離參數(shù)指示其與各中心點的第二文本型變量是否相同;根據(jù)各表數(shù)據(jù)與各中心點的距離,將多個表數(shù)據(jù)劃分為至少一個類別簇;采用設(shè)定的數(shù)據(jù)泛化算法對至少一個類別簇分別進行泛化處理。