首页 > 技术文章 > 数据分析笔记

stycoding 2021-02-06 10:13 原文

数据分析的步骤:明确问题->理解数据->数据清洗->数据分析或建模->可视化

数据分析的好习惯:

  • 将原始数据保留一份,并命名为原始数据,例如“招聘网站数据-原始数据.xls”,另外复制一份数据并命名为清洗数据,例如“招聘网站数据-清洗数据.xls”。

数据清洗的步骤(套路):选择所要用到的子集->删除重复值->缺失值处理->一致化处理->数据排序->异常值处理

“一致化处理”的意思是,例如有些字段中的数据,格式不一样,那么就要对这些数据进行处理,让他们的格式一致化,例如日期,有的日期是 2017-01-01,有的日期则是 2017/01/01 。

在Excel中进行异常值处理需要用到数据透视表。

数据透视表的原理:1.数据分组 2.应用函数 3.组合结果

对于好的数据分析项目,不是学习一次跟着做一次就好了,而是要多做几次,熟练为止。

什么是数据指标?

对当前业务有参考价值的统计数据。

① “对当前业务有参考价值”:不是所有数据都能称为指标,与当前业务无关的,没有参考意义。

② ”统计数据“:数据不是凭空产生的,不能脱离现实。

推荐阅读