一種工單數(shù)據(jù)的處理方法、裝置、電子設(shè)備及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202110582019.1 | 申請日 | - |
公開(公告)號 | CN113254640A | 公開(公告)日 | 2021-08-13 |
申請公布號 | CN113254640A | 申請公布日 | 2021-08-13 |
分類號 | G06F16/35(2019.01)I;G06F16/31(2019.01)I;G06F40/289(2020.01)I;G06F40/216(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 易存道 | 申請(專利權(quán))人 | 北京寶蘭德軟件股份有限公司 |
代理機構(gòu) | 北京路浩知識產(chǎn)權(quán)代理有限公司 | 代理人 | 王慶龍 |
地址 | 100020北京市朝陽區(qū)東三環(huán)北路19號中青大廈803 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種工單數(shù)據(jù)的處理方法、裝置、電子設(shè)備及存儲介質(zhì),方法包括:獲取待處理文本數(shù)據(jù),其中,所述待處理文本數(shù)據(jù)是指待聚類的工單文本數(shù)據(jù);對所述待處理文本數(shù)據(jù)進行分詞和向量化處理,獲取所述待處理文本數(shù)據(jù)的向量數(shù)據(jù);基于局部敏感哈希算法對所述向量數(shù)據(jù)進行聚類分析處理,將所述向量數(shù)據(jù)分成若干個候選集;計算所述候選集中各個向量數(shù)據(jù)之間的距離;確認(rèn)所述各個向量數(shù)據(jù)之間的距離屬于預(yù)設(shè)閾值范圍時,將所述各個向量數(shù)據(jù)歸為同一類別。本發(fā)明提供的工單數(shù)據(jù)處理方法,能夠應(yīng)用于海量工單數(shù)據(jù)聚類處理中,提高工單數(shù)據(jù)處理的速度,保證工單數(shù)據(jù)處理的時效性。 |
