首页 > 解决方案 > HDBSCAN 近似预测总是返回 0 的概率

问题描述

我正在使用HDBSCAN为给定的集群模型生成预测数据。然后,我尝试使用该approximate_predict函数对新点进行分类,以找到新点的正确聚类。该模型为新点返回正确的聚类,但概率/强度始终为 0.0。为了生成模型并对新点进行分类,我使用:

# Generate the model
cluster_model = hdbscan.HDBSCAN(metric='euclidean', min_cluster_size=3, cluster_selection_epsilon=0.4,
                                prediction_data=True).fit(data)

# Classify new point
cluster, prob = hdbscan.approximate_predict(cluster_model, new_point)
print(cluster, prob)

据我了解,如果强度/概率为 0.0,则该点被归类为噪声。通过对新点的手动分析,我可以看到它们确实适合原始集群的核心,所以我不明白为什么概率总是 0.0?

标签: pythonscikit-learnhdbscan

解决方案


推荐阅读