python - HDBSCAN 近似预测总是返回 0 的概率
问题描述
我正在使用HDBSCAN为给定的集群模型生成预测数据。然后,我尝试使用该approximate_predict
函数对新点进行分类,以找到新点的正确聚类。该模型为新点返回正确的聚类,但概率/强度始终为 0.0。为了生成模型并对新点进行分类,我使用:
# Generate the model
cluster_model = hdbscan.HDBSCAN(metric='euclidean', min_cluster_size=3, cluster_selection_epsilon=0.4,
prediction_data=True).fit(data)
# Classify new point
cluster, prob = hdbscan.approximate_predict(cluster_model, new_point)
print(cluster, prob)
据我了解,如果强度/概率为 0.0,则该点被归类为噪声。通过对新点的手动分析,我可以看到它们确实适合原始集群的核心,所以我不明白为什么概率总是 0.0?
解决方案
推荐阅读
- python - 为什么 PySimpleGui.Input 不能正确调整高度?
- reactjs - Sulu CMF - 关联实体的过滤单个自动完成选择
- python - 带有以 UTF-8 编码的 SQL 文件的 Pandas read_sql_query
- regex - 正则表达式以防止双字节字符。只允许范围内的 ascii
- javascript - 在javascript中返回逻辑运算符中的较高值
- python - 如何撤销 django_simple_jwt 中的访问令牌?
- c++ - 折射方法彼此不一致 - 或 Snell 定律
- installation - 我需要帮助尝试在我的 MacBook 上安装 nestJS
- aws-sdk-cpp - 在为 linux 构建完整的 aws-sdk-cpp 时出现编译错误
- math - 如何判断一个点是否更靠近段的右侧?