小结
上一节
下一节
小结
人们在面对大量未知事物时,往往会采取分而治之的策略,即先将事物按照相似性分成多个组,然后按组对事物进行处理。机器学习里的聚类(Clustering)就是用来完成对事物进行分组的任务。Cluster常翻译位簇或簇类,聚类算法是对代表事物的实例的集合进行分簇(组)的算法。聚类属于无监督学习。在无监督学习中,训练样本没有标签,等同于实例。
本章先讨论了较为容易理解的k均值聚类算法,并通过一个有趣的实例向同学们展示其应用方法,然后介绍聚类算法的任务、评价和分类等知识,随后讨论了较为复杂的DBSCAN、OPTICS和AGNES等算法。

