基于引力相似度和相对密度的不确定数据流聚类

  • 郑祺 ,
  • 黄德才
展开
  • 浙江工业大学, 浙江工业大学

网络出版日期: 2025-07-02

基于引力相似度和相对密度的不确定数据流聚类

  • 郑祺 ,
  • 黄德才
Expand
  • 浙江工业大学, 浙江工业大学

Online published: 2025-07-02

摘要

针对不确定数据流聚类问题,提出一种基于引力相似度和相对密度的聚类算法.采用在线/离线两阶段处理框架,综合考虑元组之间的相似度与元组自身的不确定性,利用引力相似度为每个不断到达的数据元组寻找可能归属的微簇,以新的离群点处理和在线维护机制来适应数据流的演化情况,并在离线层使用相对密度算法进行聚类,不需要预先指定聚类数且可处理任意形状的微簇.实验结果表明,与现有的聚类方法相比,所提出的算法具有更高的聚类质量和准确度.

本文引用格式

郑祺 , 黄德才 . 基于引力相似度和相对密度的不确定数据流聚类[J]. 上海交通大学学报, 2016 , 50(6) : 873 -878 . DOI: 10.16183/j.cnki.jsjtu.2016.06.010

Abstract

针对不确定数据流聚类问题,提出一种基于引力相似度和相对密度的聚类算法.采用在线/离线两阶段处理框架,综合考虑元组之间的相似度与元组自身的不确定性,利用引力相似度为每个不断到达的数据元组寻找可能归属的微簇,以新的离群点处理和在线维护机制来适应数据流的演化情况,并在离线层使用相对密度算法进行聚类,不需要预先指定聚类数且可处理任意形状的微簇.实验结果表明,与现有的聚类方法相比,所提出的算法具有更高的聚类质量和准确度.
文章导航

/