课程:
https://study.163.com/course/courseLearn.htm?courseId=1004570029
https://www.bilibili.com/video/av9912938
这两个笔记更好:
http://www.ai-start.com/ml2014/
https://scruel.gitee.io/ml-andrewng-notes/
课时2:什么是机器学习
定义:
Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.定义:没有明确设置的情况下,使机器具有学习能力的研究领域。
Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.定义:一个适当的学习问题定义如下,计算机从经验E中学习,解决某一任务T进行某一性能度量P,通过P测定在T上的表现因经验E而提高。
e.g. spam email:T给邮件分类 E观察是否把邮件标记为垃圾邮件 P正确归类的邮件的比例
学习算法:
监督学习(教计算机做事)、无监督学习(机器自己学习)、强化学习、推荐系统.....
课时3:监督学习
定义:给算法一个数据集包含正确答案,目的给出更多正确答案
回归问题(Regression Problem):预测连续值 (real-valued)的输出 (如具体房价)
分类问题(Classification problem):预测离散值(discrete-valued)的输出 (如0、1、2、3)
(如支持向量机,可处理无数个特征)
课时4:无监督学习
给算法大量的数据,要求它找出数据的类型结构
聚类算法:将数据集分为不同的簇
e.g
鸡尾酒会算法,两个不同方位的混合音频,分离出不同的音频
[W,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');
使用Ocatve /matlab实践这个算法。