首页 > 技术文章 > 吴恩达机器学习 笔记 第一章:绪论

wenhaoqi 2020-01-11 12:41 原文

课程:

https://study.163.com/course/courseLearn.htm?courseId=1004570029

https://www.bilibili.com/video/av9912938

 

这两个笔记更好:

http://www.ai-start.com/ml2014/ 

https://scruel.gitee.io/ml-andrewng-notes/

 

课时2:什么是机器学习

定义: 

Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.定义:没有明确设置的情况下,使机器具有学习能力的研究领域。

Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.定义:一个适当的学习问题定义如下,计算机从经验E中学习,解决某一任务T进行某一性能度量P,通过P测定在T上的表现因经验E而提高。 

e.g. spam email:T给邮件分类 E观察是否把邮件标记为垃圾邮件 P正确归类的邮件的比例 

学习算法:

监督学习(教计算机做事)、无监督学习(机器自己学习)、强化学习、推荐系统.....

 

课时3:监督学习

定义:给算法一个数据集包含正确答案,目的给出更多正确答案 

回归问题(Regression Problem):预测连续值 (real-valued)的输出 (如具体房价)

分类问题(Classification problem):预测离散值(discrete-valued)的输出 (如0、1、2、3)

(如支持向量机,可处理无数个特征)

 

课时4:无监督学习

给算法大量的数据,要求它找出数据的类型结构

 

 

聚类算法:将数据集分为不同的簇

e.g

鸡尾酒会算法,两个不同方位的混合音频,分离出不同的音频

[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');

使用Ocatve /matlab实践这个算法。

推荐阅读