首页 > 解决方案 > 多列数据的散点图

问题描述

我有一个形状为 [samples * num_of_features] num_of_features = 15,000 的数据集是否可以以任何方式可视化数据以查看是否有任何集群。我可以对它们进行聚类,但想可视化原始数据,类似于散点图。如果可以的话有什么办法吗?

标签: python

解决方案


您可能正在寻找降技术。

这些方法试图从您的数据中获取最有意义的数据,同时以较低的维度表示它[在您的情况下必须是可绘制的],并且数据丢失最少。

最流行的可能是PCA sklearn implementation,它是一种线性方法。我会从那开始。将维度减小到2,您可以像处理任何其他二维数据一样散点图。这是一个教程。我搜索了“使用 PCA 降维”。

还有更多方法,但是从您的问题陈述中不清楚哪种方法比其他方法更适合您的需求。


推荐阅读