首页 > 解决方案 > 当你有很多变量时如何进行智能数据分析

问题描述

我是新来的,我经常从事营销分析工作。大多数时候,我收到一个包含很多变量的庞大基础10 - 15

我通常会查看图表并分析每个可能的情况,但我真的相信有更好的方法来做到这一点。

age   sex     business_unit year  month revenue name  
10-20 Male    unit_1       2018    1     $100   chloe  
20-30 Female  unit_2       2019    2     $250   arnold  

我在想是否有一种方法可以结合所有可能的变量并为我提供变化,例如:

age    revenue   
10-20  -$100    year over year  

sex  revenue  
male -$200   year over year  

age   sex   revenue   
10-20 male   -$50   year over year  

以及所有其他可能的组合。有没有办法做到这一点?用 Python?

标签: pythonmachine-learning

解决方案


'corner' 模块是可视化每对变量之间关系的好工具。

这使您可以绘制每个变量的分布,并查看它们如何依赖于其他变量。例如

https://corner.readthedocs.io/en/latest/pages/custom.html

corner.py 的示例输出

使用“分位数”关键字,您可以在数据等上绘制第 16 和第 84 百分位数等。


推荐阅读