基于Single-pass的聚類方法、系統(tǒng)、裝置、存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202011563949.4 申請日 -
公開(公告)號 CN112579780A 公開(公告)日 2021-03-30
申請公布號 CN112579780A 申請公布日 2021-03-30
分類號 G06F16/35(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 代少兵 申請(專利權(quán))人 青牛智勝(深圳)科技有限公司
代理機構(gòu) 深圳市科冠知識產(chǎn)權(quán)代理有限公司 代理人 蔣芳霞
地址 518000廣東省深圳市南山區(qū)粵海街道高新區(qū)社區(qū)沙河西路1809號深圳灣科技生態(tài)園2棟A901
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及基于Single?pass的聚類方法、系統(tǒng)、裝置、存儲介質(zhì),所提供方法具體是:設(shè)置新一輪循環(huán)中初次聚類的相似度;進而,根據(jù)Single?pass以及初次聚類的相似度,進行聚類;進而,若有未被聚類的:根據(jù)上一次聚類的相似度以及預(yù)設(shè)的降值規(guī)則,獲取相似度;將上一次聚類所得的短文本主題導(dǎo)入新一次聚類中,根據(jù)相似度以及Single?pass,對上一次未被聚類的進行聚類;進而,判斷獲取相似度的步驟的執(zhí)行次數(shù)是否已達到預(yù)設(shè)的總次數(shù);進而,若未達到,跳轉(zhuǎn)到獲取相似度的步驟;若已達到,判斷是否滿足進行新一輪循環(huán)的條件;若滿足,取倒數(shù)第二次聚類的相似度為最佳相似度;若不滿足,跳轉(zhuǎn)到設(shè)置相似度的步驟。同時解決了閾值難以確定以及長尾的問題。??