支持向量机(support vector machines) 优点:泛化错误率低,计算开销不大,结果易解释 缺…
我们的任务 垃圾邮件检测是机器学习在现今互联网领域的主要应用之一。几乎所有大型电子邮箱服务提供商都内置了垃圾邮…
先补充一个物理概念 熵 Entropy: 度量事物的不确定性,不确定性越高,熵就越大,反之越确定,熵越小; 随…
分类问题 在二维空间,实际上可以等效于拟合最佳直线,将所有点分类 三围空间,就是拟合最佳平面 扩展到 n 维空…
如果只有一个预测器变量,线条的方程是 y=mx+b 图形可能如下所示: 添加一个预测器变量,变成两个预测器变量…
1. 错误类型 机器学习中常犯的两个错误是,过于简化模型,过于复杂化模型 2. 交叉验证 之前将数据分为训练集…
1. 机器学习历史 1.1 统计学视角 A Statistician’s Perspective 当前的机器学…