基于Single-pass的聚類方法、系統(tǒng)、裝置、存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202011563949.4 | 申請日 | - |
公開(公告)號 | CN112579780A | 公開(公告)日 | 2021-03-30 |
申請公布號 | CN112579780A | 申請公布日 | 2021-03-30 |
分類號 | G06F16/35(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 代少兵 | 申請(專利權(quán))人 | 青牛智勝(深圳)科技有限公司 |
代理機構(gòu) | 深圳市科冠知識產(chǎn)權(quán)代理有限公司 | 代理人 | 蔣芳霞 |
地址 | 518000廣東省深圳市南山區(qū)粵海街道高新區(qū)社區(qū)沙河西路1809號深圳灣科技生態(tài)園2棟A901 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及基于Single?pass的聚類方法、系統(tǒng)、裝置、存儲介質(zhì),所提供方法具體是:設(shè)置新一輪循環(huán)中初次聚類的相似度;進而,根據(jù)Single?pass以及初次聚類的相似度,進行聚類;進而,若有未被聚類的:根據(jù)上一次聚類的相似度以及預(yù)設(shè)的降值規(guī)則,獲取相似度;將上一次聚類所得的短文本主題導(dǎo)入新一次聚類中,根據(jù)相似度以及Single?pass,對上一次未被聚類的進行聚類;進而,判斷獲取相似度的步驟的執(zhí)行次數(shù)是否已達到預(yù)設(shè)的總次數(shù);進而,若未達到,跳轉(zhuǎn)到獲取相似度的步驟;若已達到,判斷是否滿足進行新一輪循環(huán)的條件;若滿足,取倒數(shù)第二次聚類的相似度為最佳相似度;若不滿足,跳轉(zhuǎn)到設(shè)置相似度的步驟。同時解決了閾值難以確定以及長尾的問題。?? |
