Table of Contents

第一课 课程导言

1.1 导言

大纲

时间安排

原则

先修课程

参考书

网络资源

享受之!

1.2 机器学习单元概况

1.3 什么是机器学习?

大纲

当今计算机科学的最大挑战

计算机是高效运行的机器

完全过程化合成VS完全数据化

贝叶斯推理

但是,当前它通常被当做一个黑盒来使用

确定性 VS 机率性

数据驱动模型

81.jpg

什么是机器学习

82.jpg

机器学习 != 人工智能

学习问题的主要分类

更多信息

为什么要学习机器学习?

机器学习对计算机科学和技术有用吗?

怎样才是一个成功的机器学习算法?

一些实际应用

总结

作业

参考文献

Edit by Xinyuan Luo(骆歆远), wisp@zju.edu.cn

未来体系结构对机器学习的支持

Edit by Ye Minjiao (叶敏娇, 11021036), johnye@zju.edu.cn

1.4 点估计

最大似然, 最大化后验估计, 贝叶斯估计, 回归方法与过拟合问题

你将要学习

你的第一个咨询工作

二值分布

最大似然估计

\begin{aligned} \hat{\theta} & = \arg\max_\theta P(D|\theta) \\
& = \arg\max_\theta \ln P(D|\theta) \\
& = \arg\max_\theta \ln (\theta^{\alpha_H} (1-\theta)^{\alpha_T}) \\
& = \arg\max_\theta \alpha_H\ln\theta + \alpha_T\ln(1-\theta) \end{aligned}

\hat{\theta} = \frac{\alpha_T}{\alpha_H+\alpha_T} = \frac{3}{2+3}

我需要抛多少次?

θ<sup>^</sup> = α<sub>T</sub> / α<sub>H</sub> + α<sub>T</sub>
* 富:我抛了两个头朝上和三个尾朝上
* 你:θ是3/5,我可以证明
* 富:如果我抛了20个头朝上和30个尾朝上呢
* 你:答案依然一样,我可以证明
* 富:能多解释一下吗
* 你:越多约好吗
* 富:所以我才会给你这么多报酬啊

简单边界(基于Höffding不等式)

P(|θ^ - θ*|≥ε)≤2e-2Nε^2

edit by Zhang Li,zhangli85@zju.edu.cn