资 源 简 介
k-均值聚类是数据挖掘中的聚类分析。k-均值聚类分区 n 个观测到 k 集群每个观察值属于最近均值集群目标,作为该群集的一个原型。问题是计算困难 (np) ;然而,有高效的启发式算法,并普遍采用和快速收敛到局部最优解。这些是通常类似于混合物通过这两种算法的迭代加细方法的高斯分布的期望最大化算法。此外,它们都使用聚类中心来模型数据 ;然而,k-均值聚类倾向找到集群的可比性的空间范围,而期望最大化机制允许群集,有不同的形状。在我们的项目,我们正在实施血液样本数据集的 K 均值和我们打算要从数据集,删除不需要的属性值与 null 值的数据集进行预处理,然后我们将应用 K 均值聚类算法的聚类过程的数据集。"数据集也附在附件和首选的版本的 VISUAL STUDIO 是 VS 2010"