一種基于精化單元格聚類的電子表格缺陷檢測(cè)方法

基本信息

申請(qǐng)?zhí)?/td> CN201910597185.1 申請(qǐng)日 -
公開(公告)號(hào) CN110502731B 公開(公告)日 2021-04-27
申請(qǐng)公布號(hào) CN110502731B 申請(qǐng)公布日 2021-04-27
分類號(hào) G06F40/174;G06K9/62 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 許暢;李達(dá);王慧妍;馬曉星 申請(qǐng)(專利權(quán))人 山東中創(chuàng)軟件工程股份有限公司
代理機(jī)構(gòu) 南京鐘山專利代理有限公司 代理人 上官鳳棲
地址 250014 山東省濟(jì)南市千佛山東路41-1號(hào)
法律狀態(tài) -

摘要

摘要 一種基于精化單元格聚類的電子表格缺陷檢測(cè)方法,包括如下步驟:一、利用公式單元格生成種子類:提取公式單元格的強(qiáng)特征,根據(jù)強(qiáng)特征相似度進(jìn)行初步的單元格聚類;二、對(duì)步驟一之后的剩余單元格進(jìn)行聚類:提取單元格的弱特征,根據(jù)弱特征相似度將剩余單元格添加到合適的種子類中,形成泛化類;三、精化步驟二中生成的泛化類:利用有效性屬性對(duì)泛化類進(jìn)行精化處理,形成精化類;四、定位精化類中的有缺陷的單元格:利用離群點(diǎn)檢測(cè)技術(shù),標(biāo)記精化類中的離群點(diǎn)為有缺陷的單元格。本發(fā)明能夠彌補(bǔ)電子表格缺陷檢測(cè)技術(shù)的不足,利用兩階段的單元格聚類技術(shù),提高聚類的召回率,并利用有效性屬性來(lái)提高聚類的精度,從而提升電子表格缺陷檢測(cè)的效果。