并非所有点都在一个簇中时的聚类点

Clustering points when not all points are in a cluster

我在下面绘制了一组坐标。我想将重叠点(用红色圈出的点)聚集在一起,但是,我希望忽略所有其他不重叠的点(没有用红色圈出的点)。我不能使用 K 均值聚类,因为那样会聚类所有点,包括我想忽略的点。我在想我该怎么做。谢谢

期望的输出:

输入:

不只有 k-means。如果你只考虑 k-means,你就错过了 50 年的研究。

例如DBACAN有不属于任何簇的噪声点的概念。

但是,在您的情况下,您实际上并不是在寻找聚类。

相反,您想执行相似性自连接。因为据我所知。您想要匹配 点。它是一种特殊的连接。对此没有标准语法,但可以将其视为 SELECT a.p, b.p FROM data AS a JOIN data AS b WHERE distance(a.p, b.p) < threshold.