首页 > 技术文章 > ML_简单线性回归

wuweixiong 2019-02-28 10:04 原文

1. 前提介绍:

为什么需要统计量?

    统计量:描述数据特征

    1.1 集中趋势衡量

      1.1.1 均值(平均数、平均值)(mean)

        

      {6 2 9 1 2}

      (6+2+9+1+2)/5=4

      1.1.2 中位数(medain):将数据中的各个数值按照大小顺序排列,居于中间位置的变量

      1.1.3 众数(mode):数据中出现次数最多的数

    1.2

      1.2.1 离散程度衡量

        1.2.1.1 方差(variance) 

      1.2.1.2 标准差(standard  deviation)

 

 

 

 

1. 介绍:回归(regression)Y变量为连续数值型(continuous numerical variable)

    如:房价,人数,降雨量

    分类(classification):Y变量为类别型(categorical  variable)

    如:颜色类别,电脑品牌,有无信誉

2. 简单线性回归(Simple Linear Regression)

  2.1很多做决定的过程通常是根据两个或多个变量之间的关系

  2.2 回归分析(regression analysis)用来建立方程模拟两个或多个变量之间如何关联  

  2.3 被预测的变量叫做:因变量(dependent variable),y,输出(output)

  2.4 被用来进行预测的变量叫做:自变量(independent variable),x,输入(input)

3. 简单线性回归介绍

  3.1 简单线性回归包含一个自变量(x)和一个因变量(y)

  3.2 以上两个变量的关系用一条直线来模拟

  3.3 如果包含两个以上的自变量,则称作多元回归分析(multiple regression)

4. 简单线性回归模型

  4.1 被用来描述因变量(y)和自变量(x)以及偏差(error)之间关系的叫做回归模型

  4.2 简单线性回归的模型是:

    

5. 简单线性回归方程

6.正向线性关系:

7. 负向线性关系:

8. 无关系:

9. 估计的简单线性回归方程

10. 

 

推荐阅读