首页 > 技术文章 > 数据分析中图表的选择

taoziTTW 2021-08-25 20:25 原文

1、折线图

  作用:适合于随时间变化的递增或递减变量,有规律可循,需要了解某变量在一段时间的趋势变化,就用折线图。

  注意:折线图条数过多不宜放在一张图内

  具体例子:公司的A商品的年销售趋势。

2、柱状图

  作用:各类别之间的对比。

  注意:垂直柱状图最多12个分类,横向柱状图最多30个分类。分类名过长,选用横向柱状图。

  具体例子:每月降雨量

3、直方图

  作用:查看各组数据数量分布的情况,用于观察异常或孤立数据。

  具体例子:

  注意:样本不少于50个。区别于柱状图(柱状图是查看每个类别的大小,而直方图则是查看各组数据数量分布的情况)。

4、散点图

  作用:查看变量之间的相关性以及相关程度。

  根据样本数据特征计算出回归方程。

  具体例子:身高和体重的关系

5、饼状图

  作用:显示分类之间的占比情况,分类个数不宜超过9个。

  注意:占比接近的,不宜使用,可以使用柱状图。

  具体例子:A城市少年、青年、壮年、中年、老年人的每月读书情况占比

6、箱线图

  核心指标:四分位数。

  将一组数据按从小到大顺序排列,等分为4份。

  • 下四分位数:Q1=25%的数据处
  • 上四分位数:Q3=75%的数据处
  • 中位数:Q2
  • IQR=Q3-Q1
  • 下限值=Q1-1.5*IQR
  • 上限值=Q3+1.5*IQR

  注意:上限值不是最大值,下限值也不是最小值。

  作用:

    直观明了识别数据中的异常值;

    判断数据的偏态:偏上说明整体水平在中上,区域跨度较大说明数据分布差异较大;

    比较多组数据的分布情况。若只比较一组数据的分布情况,使用直方图。

  具体例子:各城市的薪资分布情况

推荐阅读