一種數(shù)值型數(shù)據(jù)庫表中異常數(shù)據(jù)檢測方法
基本信息
申請?zhí)?/td> | CN202011428152.3 | 申請日 | - |
公開(公告)號(hào) | CN112732707A | 公開(公告)日 | 2021-04-30 |
申請公布號(hào) | CN112732707A | 申請公布日 | 2021-04-30 |
分類號(hào) | G06F16/22;G06K9/62 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 彭亞楠;黃浩;李宗鵬 | 申請(專利權(quán))人 | 南京萬般上品信息技術(shù)有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 211800 江蘇省南京市中國(江蘇)自由已試驗(yàn)區(qū)南京片區(qū)研創(chuàng)園團(tuán)結(jié)路99號(hào)孵鷹大廈1914室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種數(shù)值型數(shù)據(jù)庫表中異常數(shù)據(jù)檢測方法,首先,對(duì)于給定未標(biāo)簽數(shù)據(jù)集S構(gòu)造其k近鄰圖,其中k值由算法自動(dòng)選??;然后基于構(gòu)造的k近鄰圖,給定變化系數(shù)Vc(Variationcoefficient)的定義,對(duì)數(shù)據(jù)集中的每一個(gè)節(jié)點(diǎn)計(jì)算其變化系數(shù)Vc值;接著從所有節(jié)點(diǎn)中找出Vc值最大的節(jié)點(diǎn)x,并向貼標(biāo)者詢問得到其類別標(biāo)簽yx,并分別將x與yx加入所選數(shù)據(jù)樣本集合I與所選數(shù)據(jù)樣本真實(shí)類別標(biāo)簽集合L中。本發(fā)明通過建立數(shù)據(jù)集的k近鄰圖,能夠充分利用局部數(shù)據(jù)分布的突變定位異常區(qū)域,并顯著減少了發(fā)現(xiàn)數(shù)據(jù)集中全部異常數(shù)據(jù)所需要的問詢次數(shù),從而提升異常數(shù)據(jù)檢測的發(fā)現(xiàn)效率和準(zhǔn)確率。 |
