一種基于動態(tài)規(guī)劃方法實現數據去重裝置及方法

基本信息

申請?zhí)?/td> CN201711372970.4 申請日 -
公開(公告)號 CN108052626A 公開(公告)日 2018-05-18
申請公布號 CN108052626A 申請公布日 2018-05-18
分類號 G06F17/30 分類 計算;推算;計數;
發(fā)明人 余良波;余國晶;洪玉;李華;雷俊智 申請(專利權)人 號百信息服務有限公司
代理機構 北京高沃律師事務所 代理人 號百信息服務有限公司
地址 200080 上海市虹口區(qū)四川北路61號13-19樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種基于動態(tài)規(guī)劃方法實現數據去重裝置及方法。包括數據排序單元,數據分組單元,數據清洗單元,數據相似度分析單元,數據輸出單元;對所有數據進行排序得到排序后數據;將相似的排序后數據編成數據組;對數據組內提取source和traget進行清洗得到清洗后數據;對所述清洗后數據進行相似度分析得到分析結果;判斷分析結果是否合格,判斷合格后,輸出合格數據。本發(fā)明大大降低人工匹配相似度信息,減少人工成本,提高工作效率,也保證數據質量準確性、一致性、標準性、完整性。