python - 使用 check_correlation 加速 pandas 分析?
问题描述
使用 pandas 分析生成报告。数据集的大小非常大,以加快处理我试图关闭相关性,所以我使用了我看到的另一篇文章中的 check_correlations,ValueError:配置参数“check_correlation”不存在。那么我从使用这条线得到的问题是
a = prof.ProfileReport(df, title='Downloads', check_correlation=False)
这产生了这个问题
ValueError:配置参数“check_correlation”不存在。
解决方案
由于他们更改了版本 2 的配置,您可以将其用作:
import pandas_profiling
profile = df.profile_report(check_correlation_pearson=False,
correlations={'pearson': False,
'spearman': False,
'kendall': False,
'phi_k': False,
'cramers': False,
'recoded': False})
关闭相关性。但是,它仍然没有 1.4 版那么快。您还可以在此处调查其他配置。
推荐阅读
- r - 在R中的一行向量中打印循环输出
- javascript - Google Analytics 中点击跟踪的目标空白(在新窗口中打开)
- c++ - 除了好的做法之外,是否有理由在成员初始化程序之前调用基类构造函数?
- javascript - 如何调用 php echo 中的 js 脚本
- typescript - 为什么我的 .d.ts 文件中的私有 getter 会出现隐含的“任何”错误?
- c# - HttpRequest 不包含“GetClientCertificate”的定义(您是否缺少 using 指令或程序集引用)错误
- c# - 按下微调器按钮时,WPF 中的 DateTimePicker 不会更改日期
- python-3.x - Unable to make a error plot [Value error:too many values to unpack (expect 1)]
- excel - MailMerge 错误:对象不支持此属性或方法
- angular - ClrDatagrid 在路由上保留分页状态