一種工單數(shù)據(jù)的處理方法、裝置、電子設(shè)備及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202110582019.1 申請日 -
公開(公告)號 CN113254640A 公開(公告)日 2021-08-13
申請公布號 CN113254640A 申請公布日 2021-08-13
分類號 G06F16/35(2019.01)I;G06F16/31(2019.01)I;G06F40/289(2020.01)I;G06F40/216(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 易存道 申請(專利權(quán))人 北京寶蘭德軟件股份有限公司
代理機構(gòu) 北京路浩知識產(chǎn)權(quán)代理有限公司 代理人 王慶龍
地址 100020北京市朝陽區(qū)東三環(huán)北路19號中青大廈803
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種工單數(shù)據(jù)的處理方法、裝置、電子設(shè)備及存儲介質(zhì),方法包括:獲取待處理文本數(shù)據(jù),其中,所述待處理文本數(shù)據(jù)是指待聚類的工單文本數(shù)據(jù);對所述待處理文本數(shù)據(jù)進行分詞和向量化處理,獲取所述待處理文本數(shù)據(jù)的向量數(shù)據(jù);基于局部敏感哈希算法對所述向量數(shù)據(jù)進行聚類分析處理,將所述向量數(shù)據(jù)分成若干個候選集;計算所述候選集中各個向量數(shù)據(jù)之間的距離;確認(rèn)所述各個向量數(shù)據(jù)之間的距離屬于預(yù)設(shè)閾值范圍時,將所述各個向量數(shù)據(jù)歸為同一類別。本發(fā)明提供的工單數(shù)據(jù)處理方法,能夠應(yīng)用于海量工單數(shù)據(jù)聚類處理中,提高工單數(shù)據(jù)處理的速度,保證工單數(shù)據(jù)處理的時效性。