数据分析的步骤:明确问题->理解数据->数据清洗->数据分析或建模->可视化
数据分析的好习惯:
- 将原始数据保留一份,并命名为原始数据,例如“招聘网站数据-原始数据.xls”,另外复制一份数据并命名为清洗数据,例如“招聘网站数据-清洗数据.xls”。
数据清洗的步骤(套路):选择所要用到的子集->删除重复值->缺失值处理->一致化处理->数据排序->异常值处理
“一致化处理”的意思是,例如有些字段中的数据,格式不一样,那么就要对这些数据进行处理,让他们的格式一致化,例如日期,有的日期是 2017-01-01,有的日期则是 2017/01/01 。
在Excel中进行异常值处理需要用到数据透视表。
数据透视表的原理:1.数据分组 2.应用函数 3.组合结果
对于好的数据分析项目,不是学习一次跟着做一次就好了,而是要多做几次,熟练为止。
什么是数据指标?
对当前业务有参考价值的统计数据。
① “对当前业务有参考价值”:不是所有数据都能称为指标,与当前业务无关的,没有参考意义。
② ”统计数据“:数据不是凭空产生的,不能脱离现实。