首页 > 技术文章 > 数据分析 Day1

erice-he 2020-02-24 20:29 原文

1-1、数据分析介绍
数据分析内容:基础概念和环境、matplotlib(画图)、numpy(处理数值型的数组的)、pandas(处理数值型的数据,处理字符串、时间序列、列表和字典等)
一、综述
1、为什么要学习数据分析
2、什么是数据分析
3、环境安装
4、认识jupyter notebook

为什么要学习数据分析?
生活中我们可以遇到很多数据,流量,点击量、银行账户中的金额,个人数据等等…几万,几十万,甚至上千万。我们需要从这些数据中获取一定的规律或信息供我们使用,或者之后的工作。但是对我们人来说,如此庞大的数据超出了我们的统计和分析能力。因此我们可以借助计算机将这些数据以图、表等形式可视化,便于我们直观的感受。(+图,表)
同时:
1、有岗位需求:我们会通过爬虫爬取一些数据,存到数据库或交给前端。(爬虫、web、机器学习)
2、是python数据科学的基础
3、是机器学习课程的基础

什么是数据分析
数据分析是用适当的方法对收集来的大量数据进行分析,帮助人们做出判断,一遍采取适当的行动。

数据分析的流程
提出问题—准备数据—分析数据—获得结论—结果可视化
-------
1-2 conda环境安装
conda:data science package & environment manager
创建环境:
conda create --name python3 python=3
切换环境:
windows:activate python3
官方地址:https//www.anaconda.com/download/

认识jupyter notebook
直接再命令窗口中输入jupyter notebook即可。

推荐阅读