首页 > 解决方案 > 使用 check_correlation 加速 pandas 分析?

问题描述

使用 pandas 分析生成报告。数据集的大小非常大,以加快处理我试图关闭相关性,所以我使用了我看到的另一篇文章中的 check_correlations,ValueError:配置参数“check_correlation”不存在。那么我从使用这条线得到的问题是

a = prof.ProfileReport(df, title='Downloads', check_correlation=False)

这产生了这个问题

ValueError:配置参数“check_correlation”不存在。

标签: pythonpandaspandas-profiling

解决方案


由于他们更改了版本 2 的配置,您可以将其用作:

import pandas_profiling

profile = df.profile_report(check_correlation_pearson=False,
correlations={'pearson': False,
'spearman': False,
'kendall': False,
'phi_k': False,
'cramers': False,
'recoded': False})

关闭相关性。但是,它仍然没有 1.4 版那么快。您还可以在此处调查其他配置。


推荐阅读