首页 > 解决方案 > 聚类文档时如何获取model.predict()的概率百分比

问题描述

text = "Some random text string that I want to cluster"
Y = vectorizer.transform([text])
prediction = model.predict(Y)
print(prediction)

上面传递了一个字符串值,然后它返回它认为属于的集群组(三个之一)。

我怎样才能找出它的预测准确率的百分比是多少。IE。这个特定的文本与第 1 组有 90% 的一致性,下一个文本可能与第 2 组有 45% 的一致性,但它仍然会进入第 2 组。我希望能够捕获精度较低的项目。

标签: pythoncluster-analysis

解决方案


完全没有,通常情况下。

甚至一些(少数)聚类器在内部以一定的概率工作,并且可能具有predict_proba获取这些值的功能,这些值与其说是准确性,不如说是相对责任。


推荐阅读