python - 当你有很多变量时如何进行智能数据分析
问题描述
我是新来的,我经常从事营销分析工作。大多数时候,我收到一个包含很多变量的庞大基础10 - 15
(
我通常会查看图表并分析每个可能的情况,但我真的相信有更好的方法来做到这一点。
age sex business_unit year month revenue name
10-20 Male unit_1 2018 1 $100 chloe
20-30 Female unit_2 2019 2 $250 arnold
我在想是否有一种方法可以结合所有可能的变量并为我提供变化,例如:
age revenue
10-20 -$100 year over year
sex revenue
male -$200 year over year
age sex revenue
10-20 male -$50 year over year
以及所有其他可能的组合。有没有办法做到这一点?用 Python?
解决方案
'corner' 模块是可视化每对变量之间关系的好工具。
这使您可以绘制每个变量的分布,并查看它们如何依赖于其他变量。例如
https://corner.readthedocs.io/en/latest/pages/custom.html
使用“分位数”关键字,您可以在数据等上绘制第 16 和第 84 百分位数等。
推荐阅读
- ios - CGContext & CGMutablePath 画线 但它被颠倒了
- c++ - 获取类的第一个模板参数
- c - 给定 -2 到 +2 的边界,表示 n/2^k 需要多少精度?
- python - 为什么这个按钮不去左下角tkinter?
- android - 带有 appbar_scrolling_view_behavior 的 CoordinatorLayout 导致 adjustResize 出现问题
- c# - .Net Core 3.0 HTTP 错误 500.30 - 尝试在启动类中添加 AddHostedService() 时 ANCM 进程内启动失败
- html - 在 Visual Studio 2019 中使用的 Razor 视图未更新
- python - 当我尝试使用 pyinstaller 时它声称它没有安装,当我尝试安装它时它声称它已经安装?
- java - 如何在使用自定义方式保存数据 RecyclerView 时制作列表更改动画
- node.js - Google App Engile,Node JS,无法提供 javascript 静态文件