聚类算法
聚类是一种任务,其希望通过一些手段将数据分成不同的聚类(或者说组),而这些聚类满足:
- 聚类内相似度高
- 聚类外相似度低
不严谨地说,其是在寻找物体之间自然的分组。
聚类通常有很多角度,例如对于一群人,我们可以根据职业进行聚类,也可以根据性别进行聚类。这些都是不同的聚类角度。
聚类算法是指解决聚类任务的算法。 通常来说,其为非监督学习。
通常来说在给定数据集
定义不同数据点的距离为 (即两个不同数据点的相似度)
我们的目标是将这些数据点划分为 组。
聚类是一种任务,其希望通过一些手段将数据分成不同的聚类(或者说组),而这些聚类满足:
不严谨地说,其是在寻找物体之间自然的分组。
聚类通常有很多角度,例如对于一群人,我们可以根据职业进行聚类,也可以根据性别进行聚类。这些都是不同的聚类角度。
聚类算法是指解决聚类任务的算法。 通常来说,其为非监督学习。
通常来说在给定数据集
定义不同数据点的距离为 (即两个不同数据点的相似度)
我们的目标是将这些数据点划分为 组。