python - 无法为大型数据集运行选择性 pandas 分析
问题描述
我有一个包含 100 列和 100000 行的大型数据集,我正在尝试运行 pandas 配置文件报告,但它会生成一个非常大的文件 html 文件(300MB)。无法在任何浏览器上打开该文件。
所以我尝试了 minimum=True 但这只是提供交互。
我可以运行选择性熊猫分析报告以仅查看交互报告或仅查看缺少 _values 报告吗
我试过这个但遇到了错误
ProfileReport(df,variables=False,Interactions=True, Correlations=False, Missing_values=False, Sample=False)
解决方案
通过调整配置可以有多种可能的改进:
- 绘制与 100 列的交互会生成 100 x 100 = 10.000 个图。您可以通过指定目标将其缩小到您感兴趣的目标(请参阅文档)
- 这
ProfileReport(df,variables=False,Interactions=True, Correlations=False, Missing_values=False, Sample=False)
不是正确的语法(请不要使用大写,使用None
代替 False,请参阅此页面)。
推荐阅读
- python - 使用像素坐标在图像上绘制多个标记(OpenCV)
- c - 将 C api 动态暴露给 squirrel
- c# - 为什么我的应用程序无法通过集成网络摄像头检测到二维码?
- json - 在flutter中显示POST请求的结果
- sql - 合并包含由 ColumnA 的下一个结果预测的 ColumnA 的行
- excel - 错误 - 运行时错误 13. 如何将行数加起来?
- sql - 如何从表中获取相关的源和目的地航班
- laravel - 如何禁用 Laravel 调度程序日志
- jmeter - 无法使用 Jmeter 上传 csv 文件
- c# - c# AsyncSockets 从客户端套接字读取时递归