數(shù)據(jù)質量治理方法、裝置、設備及存儲介質

基本信息

申請?zhí)?/td> CN202111203090.0 申請日 -
公開(公告)號 CN113656395B 公開(公告)日 2022-03-15
申請公布號 CN113656395B 申請公布日 2022-03-15
分類號 G06F16/215(2019.01)I;G06F16/2455(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 周文明;花霖;馮建設;陳軍;劉桂芬;王春洲;張挺軍;楊歡;朱瑜鑫 申請(專利權)人 深圳市信潤富聯(lián)數(shù)字科技有限公司
代理機構 深圳市中科創(chuàng)為專利代理有限公司 代理人 徐方星
地址 518000廣東省深圳市羅湖區(qū)桂園街道老圍社區(qū)深南東路5016號蔡屋圍京基一百大廈A座2001-06
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種數(shù)據(jù)質量治理方法、裝置、設備及存儲介質,所述方法包括:提取新輸入數(shù)據(jù)庫的新輸入數(shù)據(jù)段,對所述新輸入數(shù)據(jù)段的特征點進行拆解,將拆解后的所述新輸入數(shù)據(jù)段的特征點與所述數(shù)據(jù)庫的原數(shù)據(jù)段的特征點進行相似特征匹配,根據(jù)所述相似特征匹配的結果得到所述新輸入數(shù)據(jù)段的相似等級,提取相似等級高于第一閾值的所述新輸入數(shù)據(jù)段,通過數(shù)據(jù)相似度算法對相似等級高于所述第一閾值的所述新輸入數(shù)據(jù)段進行計算,得到數(shù)據(jù)相似度結果,根據(jù)所述數(shù)據(jù)相似度結果,將相似度高于第二閾值的所新輸入述數(shù)據(jù)段整合到所述數(shù)據(jù)庫中。本發(fā)明使得數(shù)據(jù)整合和質量治理的效率較高,同時誤碼率低、整合反應速度增快。