Journal of Shanghai Jiao Tong University ›› 2016, Vol. 50 ›› Issue (6): 873-878.doi: 10.16183/j.cnki.jsjtu.2016.06.010

Previous Articles    

基于引力相似度和相对密度的不确定数据流聚类

郑祺, 黄德才   

  1. 浙江工业大学, 浙江工业大学
  • Published:2025-07-02

Abstract: 针对不确定数据流聚类问题,提出一种基于引力相似度和相对密度的聚类算法.采用在线/离线两阶段处理框架,综合考虑元组之间的相似度与元组自身的不确定性,利用引力相似度为每个不断到达的数据元组寻找可能归属的微簇,以新的离群点处理和在线维护机制来适应数据流的演化情况,并在离线层使用相对密度算法进行聚类,不需要预先指定聚类数且可处理任意形状的微簇.实验结果表明,与现有的聚类方法相比,所提出的算法具有更高的聚类质量和准确度.

Key words: 不确定数据流, 聚类, 引力, 相似度, 相对密度, 离群点