《基于主动学习的微博聚类分析》 |
|
摘要:K-Means聚类算法由于无法准确确定初始化聚类中心,容易造成聚类结果准确率低下。对微博数据聚类时,可能会导致无法正确反映兴趣热点。本文设计了基于主动学习的聚类算法,在确定初始聚类中心过程中应用Min-Max主动学习策略,使得算法每次在很小数量的查询后都会提供数据点供用户进行初始中心点确认,并在K—Means算法中重新计算聚类中心时设置其权重值,从而减少迭代的数量,提高聚类结果的准确率,并将这一算法运用于微博聚类分析,得出微博热门话题。
![]()
购买主题
本主题需向作者支付 30 金钱 才能浏览
|