一種表數(shù)據(jù)泛化方法及裝置
基本信息
申請?zhí)?/td> | CN202210184206.9 | 申請日 | - |
公開(公告)號 | CN114548303A | 公開(公告)日 | 2022-05-27 |
申請公布號 | CN114548303A | 申請公布日 | 2022-05-27 |
分類號 | G06K9/62(2022.01)I;G06F40/30(2020.01)I;G06F40/177(2020.01)I;G06F21/62(2013.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 張正欣;牟黎明;王豪;肖春亮;張宏;何坤 | 申請(專利權(quán))人 | 神州綠盟成都科技有限公司 |
代理機構(gòu) | 北京同達信恒知識產(chǎn)權(quán)代理有限公司 | 代理人 | - |
地址 | 610015四川省成都市中國(四川)自由貿(mào)易試驗區(qū)成都高新區(qū)和樂二街150號C區(qū)5棟1層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了一種表數(shù)據(jù)泛化方法及裝置,用以提升表數(shù)據(jù)泛化的效率。該方法包括:確定待泛化的表中多個表數(shù)據(jù)分別包括的各類型的子數(shù)據(jù),其中子數(shù)據(jù)的類型包括數(shù)值型、包含語義的第一文本型以及不包含語義的第二文本型;根據(jù)任一表數(shù)據(jù)包括的各類型的子數(shù)據(jù)的距離參數(shù),確定其與各中心點的距離;其中數(shù)值型子數(shù)據(jù)與各中心點的數(shù)值型變量的相似程度為其距離參數(shù);第一文本型子數(shù)據(jù)與各中心點的第一文本型變量的相似程度為其距離參數(shù);第二文本型子數(shù)據(jù)的距離參數(shù)指示其與各中心點的第二文本型變量是否相同;根據(jù)各表數(shù)據(jù)與各中心點的距離,將多個表數(shù)據(jù)劃分為至少一個類別簇;采用設(shè)定的數(shù)據(jù)泛化算法對至少一個類別簇分別進行泛化處理。 |
