首页 > 解决方案 > 如何评估 kmeans 算法的测试误差

问题描述

我试图了解如何在未用于 kmeans 算法训练的测试集上评估错误 (1 - R^2)。特别是在这个模型定义之后

kmeans = KMeans(n_clusters=5, n_init=10, random_state=rs)
kmeans.fit(Xtrain)

我为每个集群学习了一个线性模型,并通过这个函数计算了误差

(1-lr.score(cluster, Y_cluster))

现在,我想在测试集上看到同样的错误,所以,在网上搜索,我发现 .predict(Xtest) 函数有助于将测试集的每个元素链接到其相关集群。我还注意到返回的所有值都是 0 或 3。从现在开始,我一直纠结于如何使用上面报告的 score() 函数计算错误,我尝试使用 (Xtest[kmeans.labels_==i]但它返回错误。有什么帮助吗?

标签: pythonscikit-learnk-means

解决方案


推荐阅读