python - 如何仅使用 Pandas Profilling 包生成相关性和散点图?
问题描述
我正在处理一个大型数据集,并且我使用了 Pandas Profilling 包。但是由于数据集很大,生成报告的时间太长,并且浏览器无法打开它。所以,我使用了“mininmal=True”命令,它不包括相关矩阵和散点图。有什么方法可以只使用 Pandas Profilling 生成相关矩阵和散点图。
from pandas_profiling import ProfileReport
profile = ProfileReport(df, title='EDA_Raw_Data', html={'style':{'full_width':True}},minimal=True)
profile.to_file(output_file="EDA1_Raw_Data.html")
解决方案
这是部分可能的。
要将 pandas-profiling 的配置设置为仅显示散点图(或 hexbins)和相关图,您可以从最小配置开始:
然后,更改配置以排除您想要禁用的计算(例如,将样本设置为零)。
from pandas_profiling import ProfileReport
profile = ProfileReport(df, configuration_file="your_config.yml")
profile.to_file("EDA1_Raw_Data.html")
请注意,此时无法禁用所有计算(在 v2.6.0 中)。请为此在存储库中提出功能请求。
(免责声明:作者在此处。请注意,即将推出的 v2.7.0 包含显着的性能改进,这也可能解决您的问题。)
推荐阅读
- laravel - 如何在 AWS 上更新 laravel 项目
- django - 如何使用 Docker 扩展 Heroku Django Celery 应用程序
- yocto - 构建中的内核源代码在哪里?
- html - 如何隐藏块
- javascript - 下拉值动态更改页面样式
- python - 在 Python 中获取字典的子集时出错
- reactjs - 使用 React Hooks 的级联下拉
- android - Android studio:VM初始化时出错
- c# - 如何在由自定义对象创建的属性上使用 Blazor ValidationMessage
- angular - Angular - 在指令的构造函数中使用 Renderer2