二等分 k-means

“二等分 k-means”聚类算法将 k-means 聚类与划分层次聚类相结合。使用二等分 k-means,您不仅可以获得群集,还可以获得数据点群集的层次结构。

该层次结构比 K-均值 返回的非结构化平面群集集合提供更多信息。该层次结构显示聚类结果如何查看群集二等分过程的每个步骤以查找新群集。利用群集的层次结构,可以更轻松地确定数据集中的群集数量。

给定由二等分 k-means 产生的 k 群集的层次结构,您可以轻松计算以下形式的任何预测:假设数据只包含 k' 个群集,其中 k' 是一个数字,它小于或等于用于训练模型的 k

有关如何使用二等分 k-means 在 Vertica 中分析表的完整示例,请参阅使用二等分 k-means 对数据进行分层聚类