专栏名称: 量子位
վ'ᴗ' ի 追踪AI行业和技术动态,这里更快一步!关注我们,回复“今天”,更多大新闻等你来发现
目录
相关文章推荐
黄建同学  ·  Google 的 《Agents ... ·  昨天  
爱可可-爱生活  ·  [CL]《Reasoning LLMs ... ·  2 天前  
黄建同学  ·  Manus 也来卷 PPT ... ·  2 天前  
新智元  ·  斯坦福华人天团意外爆冷!AI用纯CUDA-C ... ·  2 天前  
51好读  ›  专栏  ›  量子位

一文解读聚类中的两种流行算法

量子位  · 公众号  · AI  · 2017-11-20 13:02

正文

请到「今天看啥」查看全文


1.K-均值聚类算法

2.层次聚类

K-均值聚类

1.以你想要的簇的数量K作为输入,随机初始化每个簇的中心。

2.现在,在数据点和中心点的欧氏距离,将每个数据点分配给离它最近的簇。

3.将第二步中每个簇数据点的均值作为新的聚类中心。

4.重复步骤2和步骤3直到聚类中心不再发生变化。

你可能会问,如何在第一步中决定K值?

一种“肘部法则”(Elbow Method)可以用来确定最佳聚类数。你可以在K值范围内运行K-均值聚类,并在Y轴上绘制“可解释方差的比例”,在X轴上绘制K值。

在下面这张图片中可以注意到,当簇扩大到三个以上时,就不能对数据很好建模了。第一个簇增加了很多信息,但某些时候,边际收益将开始下降。







请到「今天看啥」查看全文