python - 多列数据的散点图
问题描述
我有一个形状为 [samples * num_of_features] num_of_features = 15,000 的数据集是否可以以任何方式可视化数据以查看是否有任何集群。我可以对它们进行聚类,但想可视化原始数据,类似于散点图。如果可以的话有什么办法吗?
解决方案
您可能正在寻找降维技术。
这些方法试图从您的数据中获取最有意义的数据,同时以较低的维度表示它[在您的情况下必须是可绘制的],并且数据丢失最少。
最流行的可能是PCA sklearn implementation,它是一种线性方法。我会从那开始。将维度减小到2
,您可以像处理任何其他二维数据一样散点图。这是一个教程。我搜索了“使用 PCA 降维”。
还有更多方法,但是从您的问题陈述中不清楚哪种方法比其他方法更适合您的需求。
推荐阅读
- css - 在响应式站点上,打印时应用哪个断点?
- ruby-on-rails - NoMethodError (undefined method `email' for nil:NilClass): / Action Mailer Rails
- python - 如何按顺序执行 groupby 然后在 python/pandas 中选择第一行
- java - EnableAuthorizationServer 时出错
- email - 如何使用终端命令减去列表?
- azure-service-fabric - 如何使用 VMScaleSet 将 NodeTypes 添加到 ServiceFabric,并将特定配置(例如使用数据磁盘)添加到现有 Service Fabric 群集?
- asp.net-core - 如何更改 Visual Studio 2017 中调试的默认浏览器?
- python - 从 Python 中的函数访问类变量
- tween.js - 在循环范围 tween.js 的最短方向上补间
- laravel - Laravel:如何在没有 $hidden 属性的情况下建立关系?