一種工單數(shù)據(jù)的處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202110582019.1 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113254640A | 公開(公告)日 | 2021-08-13 |
申請(qǐng)公布號(hào) | CN113254640A | 申請(qǐng)公布日 | 2021-08-13 |
分類號(hào) | G06F16/35(2019.01)I;G06F16/31(2019.01)I;G06F40/289(2020.01)I;G06F40/216(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 易存道 | 申請(qǐng)(專利權(quán))人 | 北京寶蘭德軟件股份有限公司 |
代理機(jī)構(gòu) | 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 王慶龍 |
地址 | 100020北京市朝陽區(qū)東三環(huán)北路19號(hào)中青大廈803 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種工單數(shù)據(jù)的處理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),方法包括:獲取待處理文本數(shù)據(jù),其中,所述待處理文本數(shù)據(jù)是指待聚類的工單文本數(shù)據(jù);對(duì)所述待處理文本數(shù)據(jù)進(jìn)行分詞和向量化處理,獲取所述待處理文本數(shù)據(jù)的向量數(shù)據(jù);基于局部敏感哈希算法對(duì)所述向量數(shù)據(jù)進(jìn)行聚類分析處理,將所述向量數(shù)據(jù)分成若干個(gè)候選集;計(jì)算所述候選集中各個(gè)向量數(shù)據(jù)之間的距離;確認(rèn)所述各個(gè)向量數(shù)據(jù)之間的距離屬于預(yù)設(shè)閾值范圍時(shí),將所述各個(gè)向量數(shù)據(jù)歸為同一類別。本發(fā)明提供的工單數(shù)據(jù)處理方法,能夠應(yīng)用于海量工單數(shù)據(jù)聚類處理中,提高工單數(shù)據(jù)處理的速度,保證工單數(shù)據(jù)處理的時(shí)效性。 |
