logo资料库

吴恩达机器学习个人笔记完整版.pdf

第1页 / 共298页
第2页 / 共298页
第3页 / 共298页
第4页 / 共298页
第5页 / 共298页
第6页 / 共298页
第7页 / 共298页
第8页 / 共298页
资料共298页,剩余部分请下载后查看
第1周
一、 引言(Introduction)
1.1 欢迎
参考视频: 1 - 1 - Welcome (7 min).mkv
1.2 机器学习是什么?
参考视频: 1 - 2 - What is Machine Learning_ (7 min).mkv
1.3 监督学习
参考视频: 1 - 3 - Supervised Learning (12 min).mkv
1.4 无监督学习
参考视频: 1 - 4 - Unsupervised Learning (14 min).mkv
二、单变量线性回归(Linear Regression with One Variable)
2.1 模型表示
参考视频: 2 - 1 - Model Representation (8 min).mkv
2.2 代价函数
参考视频: 2 - 2 - Cost Function (8 min).mkv
2.3 代价函数的直观理解I
参考视频: 2 - 3 - Cost Function - Intuition I (11 min).mkv
2.4 代价函数的直观理解II
参考视频: 2 - 4 - Cost Function - Intuition II (9 min).mkv
2.5 梯度下降
参考视频: 2 - 5 - Gradient Descent (11 min).mkv
2.6 梯度下降的直观理解
参考视频: 2 - 6 - Gradient Descent Intuition (12 min).mkv
2.7 梯度下降的线性回归
参考视频: 2 - 7 - GradientDescentForLinearRegression (6 min).mkv
2.8 接下来的内容
参考视频: 2 - 8 - What_'s Next (6 min).mkv
三、线性代数回顾(Linear Algebra Review)
3.1 矩阵和向量
参考视频: 3 - 1 - Matrices and Vectors (9 min).mkv
3.2 加法和标量乘法
参考视频: 3 - 2 - Addition and Scalar Multiplication (7 min).mkv
3.3 矩阵向量乘法
参考视频: 3 - 3 - Matrix Vector Multiplication (14 min).mkv
3.4 矩阵乘法
参考视频: 3 - 4 - Matrix Matrix Multiplication (11 min).mkv
3.5 矩阵乘法的性质
参考视频: 3 - 5 - Matrix Multiplication Properties (9 min).mkv
3.6 逆、转置
参考视频: 3 - 6 - Inverse and Transpose (11 min).mkv
第2周
四、多变量线性回归(Linear Regression with Multiple Variables)
4.1 多维特征
参考视频: 4 - 1 - Multiple Features (8 min).mkv
4.2 多变量梯度下降
参考视频: 4 - 2 - Gradient Descent for Multiple Variables (5 min).mkv
4.3 梯度下降法实践1-特征缩放
参考视频: 4 - 3 - Gradient Descent in Practice I - Feature Scaling (9 min).mkv
4.4 梯度下降法实践2-学习率
参考视频: 4 - 4 - Gradient Descent in Practice II - Learning Rate (9 min).mkv
4.5 特征和多项式回归
参考视频: 4 - 5 - Features and Polynomial Regression (8 min).mkv
4.6 正规方程
参考视频: 4 - 6 - Normal Equation (16 min).mkv
4.7 正规方程及不可逆性(选修)
参考视频: 4 - 7 - Normal Equation Noninvertibility (Optional) (6 min).mkv
五、Octave教程(Octave Tutorial)
5.1 基本操作
参考视频: 5 - 1 - Basic Operations (14 min).mkv
5.2 移动数据
参考视频: 5 - 2 - Moving Data Around (16 min).mkv
5.3 计算数据
参考视频: 5 - 3 - Computing on Data (13 min).mkv
5.4 绘图数据
参考视频: 5 - 4 - Plotting Data (10 min).mkv
5.5 控制语句:for,while,if语句
参考视频: 5 - 5 - Control Statements_ for, while, if statements (13 min).mkv
5.6 向量化
参考视频: 5 - 6 - Vectorization (14 min).mkv
5.7 工作和提交的编程练习
参考视频: 5 - 7 - Working on and Submitting Programming Exercises (4 min).mkv
第3周
六、逻辑回归(Logistic Regression)
6.1 分类问题
参考文档: 6 - 1 - Classification (8 min).mkv
6.2 假说表示
参考视频: 6 - 2 - Hypothesis Representation (7 min).mkv
6.3 判定边界
参考视频: 6 - 3 - Decision Boundary (15 min).mkv
6.4 代价函数
参考视频: 6 - 4 - Cost Function (11 min).mkv
6.5 简化的成本函数和梯度下降
参考视频: 6 - 5 - Simplified Cost Function and Gradient Descent (10 min).mkv
6.6 高级优化
参考视频: 6 - 6 - Advanced Optimization (14 min).mkv
6.7 多类别分类:一对多
参考视频: 6 - 7 - Multiclass Classification_ One-vs-all (6 min).mkv
七、正则化(Regularization)
7.1 过拟合的问题
参考视频: 7 - 1 - The Problem of Overfitting (10 min).mkv
7.2 代价函数
参考视频: 7 - 2 - Cost Function (10 min).mkv
7.3 正则化线性回归
参考视频: 7 - 3 - Regularized Linear Regression (11 min).mkv
7.4 正则化的逻辑回归模型
参考视频: 7 - 4 - Regularized Logistic Regression (9 min).mkv
第4周
第八、神经网络:表述(Neural Networks: Representation)
8.1 非线性假设
参考视频: 8 - 1 - Non-linear Hypotheses (10 min).mkv
8.2 神经元和大脑
参考视频: 8 - 2 - Neurons and the Brain (8 min).mkv
8.3 模型表示1
参考视频: 8 - 3 - Model Representation I (12 min).mkv
8.4 模型表示2
参考视频: 8 - 4 - Model Representation II (12 min).mkv
8.5 样本和直观理解1
参考视频: 8 - 5 - Examples and Intuitions I (7 min).mkv
8.6 样本和直观理解II
参考视频: 8 - 6 - Examples and Intuitions II (10 min).mkv
8.7 多类分类
参考视频: 8 - 7 - Multiclass Classification (4 min).mkv
第5周
九、神经网络的学习(Neural Networks: Learning)
9.1 代价函数
参考视频: 9 - 1 - Cost Function (7 min).mkv
9.2 反向传播算法
参考视频: 9 - 2 - Backpropagation Algorithm (12 min).mkv
9.3 反向传播算法的直观理解
参考视频: 9 - 3 - Backpropagation Intuition (13 min).mkv
9.4 实现注意:展开参数
参考视频: 9 - 4 - Implementation Note_ Unrolling Parameters (8 min).mkv
9.5 梯度检验
参考视频: 9 - 5 - Gradient Checking (12 min).mkv
9.6 随机初始化
参考视频: 9 - 6 - Random Initialization (7 min).mkv
9.7 综合起来
参考视频: 9 - 7 - Putting It Together (14 min).mkv
9.8 自主驾驶
参考视频: 9 - 8 - Autonomous Driving (7 min).mkv
第6周
十、应用机器学习的建议(Advice for Applying Machine Learning)
10.1 决定下一步做什么
参考视频: 10 - 1 - Deciding What to Try Next (6 min).mkv
10.2 评估一个假设
参考视频: 10 - 2 - Evaluating a Hypothesis (8 min).mkv
10.3 模型选择和交叉验证集
参考视频: 10 - 3 - Model Selection and Train_Validation_Test Sets (12 min).mkv
10.4 诊断偏差和方差
参考视频: 10 - 4 - Diagnosing Bias vs. Variance (8 min).mkv
10.5 正则化和偏差/方差
参考视频: 10 - 5 - Regularization and Bias_Variance (11 min).mkv
10.6 学习曲线
参考视频: 10 - 6 - Learning Curves (12 min).mkv
10.7 决定下一步做什么
参考视频: 10 - 7 - Deciding What to Do Next Revisited (7 min).mkv
十一、机器学习系统的设计(Machine Learning System Design)
11.1 首先要做什么
参考视频: 11 - 1 - Prioritizing What to Work On (10 min).mkv
11.2 误差分析
参考视频: 11 - 2 - Error Analysis (13 min).mkv
11.3 类偏斜的误差度量
参考视频: 11 - 3 - Error Metrics for Skewed Classes (12 min).mkv
11.4 查准率和查全率之间的权衡
参考视频: 11 - 4 - Trading Off Precision and Recall (14 min).mkv
11.5 机器学习的数据
参考视频: 11 - 5 - Data For Machine Learning (11 min).mkv
第7周
十二、支持向量机(Support Vector Machines)
12.1 优化目标
参考视频: 12 - 1 - Optimization Objective (15 min).mkv
12.2 大边界的直观理解
参考视频: 12 - 2 - Large Margin Intuition (11 min).mkv
12.3 数学背后的大边界分类(选修)
参考视频: 12 - 3 - Mathematics Behind Large Margin Classification (Optional) (20 min).mkv
12.4 核函数1
参考视频: 12 - 4 - Kernels I (16 min).mkv
12.5 核函数2
参考视频: 12 - 5 - Kernels II (16 min).mkv
12.6 使用支持向量机
参考视频: 12 - 6 - Using An SVM (21 min).mkv
第8周
十三、聚类(Clustering)
13.1 无监督学习:简介
参考视频: 13 - 1 - Unsupervised Learning_ Introduction (3 min).mkv
13.2 K-均值算法
参考视频: 13 - 2 - K-Means Algorithm (13 min).mkv
13.3 优化目标
参考视频: 13 - 3 - Optimization Objective (7 min).mkv
13.4 随机初始化
参考视频: 13 - 4 - Random Initialization (8 min).mkv
13.5 选择聚类数
十四、降维(Dimensionality Reduction)
14.1 动机一:数据压缩
参考视频: 14 - 1 - Motivation I_ Data Compression (10 min).mkv
14.2 动机二:数据可视化
参考视频: 14 - 2 - Motivation II_ Visualization (6 min).mkv
14.3 主成分分析问题
参考视频: 14 - 3 - Principal Component Analysis Problem Formulation (9 min). mkv
14.4 主成分分析算法
参考视频: 14 - 4 - Principal Component Analysis Algorithm (15 min).mkv
14.5 选择主成分的数量
参考视频: 14 - 5 - Choosing The Number Of Principal Components (13 min).mkv
14.6 重建的压缩表示
参考视频: 14 - 6 - Reconstruction from Compressed Representation (4 min).mkv
14.7 主成分分析法的应用建议
参考视频: 14 - 7 - Advice for Applying PCA (13 min).mkv
第9周
十五、异常检测(Anomaly Detection)
15.1 问题的动机
参考文档: 15 - 1 - Problem Motivation (8 min).mkv
15.2 高斯分布
参考视频: 15 - 2 - Gaussian Distribution (10 min).mkv
15.3 算法
参考视频: 15 - 3 - Algorithm (12 min).mkv
15.4 开发和评价一个异常检测系统
参考视频: 15 - 4 - Developing and Evaluating an Anomaly Detection System (13 min). mkv
15.5 异常检测与监督学习对比
参考视频: 15 - 5 - Anomaly Detection vs. Supervised Learning (8 min).mkv
15.6 选择特征
参考视频: 15 - 6 - Choosing What Features to Use (12 min).mkv
15.7 多元高斯分布(选修)
参考视频: 15 - 7 - Multivariate Gaussian Distribution (Optional) (14 min).mkv
15.8 使用多元高斯分布进行异常检测(选修)
参考视频: 15 - 8 - Anomaly Detection using the Multivariate Gaussian Distribution (Optional) (14 min).mkv
十六、推荐系统(Recommender Systems)
16.1 问题形式化
参考视频: 16 - 1 - Problem Formulation (8 min).mkv
16.2 基于内容的推荐系统
参考视频: 16 - 2 - Content Based Recommendations (15 min).mkv
16.3 协同过滤
参考视频: 16 - 3 - Collaborative Filtering (10 min).mkv
16.4 协同过滤算法
参考视频: 16 - 4 - Collaborative Filtering Algorithm (9 min).mkv
16.5 向量化:低秩矩阵分解
参考视频: 16 - 5 - Vectorization_ Low Rank Matrix Factorization (8 min).mkv
16.6 推行工作上的细节:均值归一化
参考视频: 16 - 6 - Implementational Detail_ Mean Normalization (9 min).mkv
第10周
十七、大规模机器学习(Large Scale Machine Learning)
17.1 大型数据集的学习
参考视频: 17 - 1 - Learning With Large Datasets (6 min).mkv
17.2 随机梯度下降法
参考视频: 17 - 2 - Stochastic Gradient Descent (13 min).mkv
17.3 小批量梯度下降
参考视频: 17 - 3 - Mini-Batch Gradient Descent (6 min).mkv
17.4 随机梯度下降收敛
参考视频: 17 - 4 - Stochastic Gradient Descent Convergence (12 min). mkv
17.5 在线学习
参考视频: 17 - 5 - Online Learning (13 min).mkv
17.6 映射化简和数据并行
参考视频: 17 - 6 - Map Reduce and Data Parallelism (14 min).mkv
十八、应用实例:图片文字识别(Application Example: Photo OCR)
18.1 问题描述和流程图
参考视频: 18 - 1 - Problem Description and Pipeline (7 min).mkv
18.2 滑动窗口
参考视频: 18 - 2 - Sliding Windows (15 min).mkv
18.3 获取大量数据和人工数据
参考视频: 18 - 3 - Getting Lots of Data and Artificial Data (16 min).mkv
18.4 上限分析:哪部分管道的接下去做
参考视频: 18 - 4 - Ceiling Analysis_ What Part of the Pipeline to Work on Next (14 min).mkv
十九、总结(Conclusion)
19.1 总结和致谢
参考视频: 19 - 1 - Summary and Thank You (5 min).mkv
附件
1 常用的数学公式
一元函数微分学
(一) 随机事件和概率
(二) 随机变量及其概率分布
(三) 多维随机变量及其分布
(四) 随机变量的数字特征
(五) 大数定律和中心极限定理
(六) 数理统计的基本概念
(七) 参数估计
(八) 假设检验
斯坦福大学 2014 机器学习教程 个人笔记(V5.02) 摘要 本笔记是针对斯坦福大学 2014 年机器学习课程 视频做的个人笔记 黄海广 最后修改:2017-12-3
 文档修改历史 版本号 版本日期 修改总结 修订人 2014.12.16 创建初稿 2014.12.31 2015.02.17 2015.02.23 2015.03.02 修改 修改 修改 修改 2015.03.14 修改一些错误,增加了第十章的一些内容 2015.05.02 修改第十二章一些错误 2015.05.13 补充第九章部分内容 2016.01.11 增加第五章 OCTAVE 操作内容 2016.01.15 修改部分错误 2016.02.15 补充第二章部分内容 2016.02.19 补充第六章内容 2016.02.24 修改第十一章一些错误 2016.03.20 补充第四章部分内容 2016.03.28 补充第十五章、十六章的部分内容 2017.06.08 修改了一些翻译错误 2017.09.23 增加了数学基础和部分公式推导 2017.09.30 修改了第六章的一些错误(视频有错误) 2017.11.3 修正了一些数学公式 黄海广 黄海广 黄海广 黄海广 黄海广 黄海广 黄海广 黄海广 黄海广 黄海广 黄海广 黄海广 黄海广 黄海广 黄海广 黄海广 黄海广 黄海广 黄海广 1.0 1.1 2.0 2.1 2.2 2.3 2.4 2.5 3.0 3.1 3.2 3.3 4.0 4.1 4.2 4.3 4.4 4.5 5.0
目录 第 1 周 .............................................................................................................................................. 1 一、 引言(Introduction) .................................................................................................... 1 1.1 欢迎............................................................................................................................ 1 1.2 机器学习是什么? .................................................................................................... 4 1.3 监督学习 .................................................................................................................... 6 1.4 无监督学习 .............................................................................................................. 10 二、单变量线性回归(Linear Regression with One Variable) ................................................ 15 2.1 模型表示 .................................................................................................................. 15 2.2 代价函数 .................................................................................................................. 18 2.3 代价函数的直观理解 I ............................................................................................ 20 2.4 代价函数的直观理解 II ........................................................................................... 21 2.5 梯度下降 .................................................................................................................. 23 2.6 梯度下降的直观理解 .............................................................................................. 26 2.7 梯度下降的线性回归 .............................................................................................. 29 2.8 接下来的内容 .......................................................................................................... 31 三、线性代数回顾(Linear Algebra Review) ........................................................................... 32 3.1 矩阵和向量 .............................................................................................................. 32 3.2 加法和标量乘法 ...................................................................................................... 34 3.3 矩阵向量乘法 .......................................................................................................... 35 3.4 矩阵乘法 .................................................................................................................. 36 3.5 矩阵乘法的性质 ...................................................................................................... 37 3.6 逆、转置 .................................................................................................................. 38 第 2 周 ............................................................................................................................................ 39 四、多变量线性回归(Linear Regression with Multiple Variables) ........................................ 39 4.1 多维特征 .................................................................................................................. 39 4.2 多变量梯度下降 ...................................................................................................... 41 4.3 梯度下降法实践 1-特征缩放 ................................................................................. 43 4.4 梯度下降法实践 2-学习率 ..................................................................................... 45 4.5 特征和多项式回归 .................................................................................................. 46 4.6 正规方程 .................................................................................................................. 48 4.7 正规方程及不可逆性(选修) .............................................................................. 51 五、Octave 教程(Octave Tutorial) .......................................................................................... 54 5.1 基本操作 .................................................................................................................. 54 5.2 移动数据 .................................................................................................................. 61 5.3 计算数据 .................................................................................................................. 70 5.4 绘图数据 .................................................................................................................. 77 5.5 控制语句:for,while,if 语句 ............................................................................. 83 5.6 向量化 ...................................................................................................................... 89 5.7 工作和提交的编程练习 .......................................................................................... 94 第 3 周 ............................................................................................................................................ 97 六、逻辑回归(Logistic Regression) ........................................................................................ 97 6.1 分类问题 .................................................................................................................. 97 I
6.2 假说表示 .................................................................................................................. 99 6.3 判定边界 ................................................................................................................ 101 6.4 代价函数 ................................................................................................................ 103 6.5 简化的成本函数和梯度下降 ................................................................................ 108 6.6 高级优化 ................................................................................................................ 112 6.7 多类别分类:一对多 ............................................................................................ 117 七、正则化(Regularization) ................................................................................................. 120 7.1 过拟合的问题 ........................................................................................................ 120 7.2 代价函数 ................................................................................................................ 122 7.3 正则化线性回归 .................................................................................................... 124 7.4 正则化的逻辑回归模型 ........................................................................................ 125 第 4 周 .......................................................................................................................................... 127 第八、神经网络:表述(Neural Networks: Representation)............................................... 127 8.1 非线性假设 ............................................................................................................ 127 8.2 神经元和大脑 ........................................................................................................ 129 8.3 模型表示 1 ............................................................................................................. 133 8.4 模型表示 2 ............................................................................................................. 137 8.5 样本和直观理解 1 ................................................................................................. 139 8.6 样本和直观理解 II ................................................................................................. 141 8.7 多类分类 ................................................................................................................ 143 第 5 周 .......................................................................................................................................... 144 九、神经网络的学习(Neural Networks: Learning) ............................................................. 144 9.1 代价函数 ................................................................................................................ 144 9.2 反向传播算法 ........................................................................................................ 146 9.3 反向传播算法的直观理解 .................................................................................... 149 9.4 实现注意:展开参数 ............................................................................................ 152 9.5 梯度检验 ................................................................................................................ 153 9.6 随机初始化 ............................................................................................................ 155 9.7 综合起来 ................................................................................................................ 156 9.8 自主驾驶 ................................................................................................................ 157 第 6 周 .......................................................................................................................................... 160 十、应用机器学习的建议(Advice for Applying Machine Learning) ................................... 160 10.1 决定下一步做什么 .............................................................................................. 160 10.2 评估一个假设 ...................................................................................................... 163 10.3 模型选择和交叉验证集 ...................................................................................... 165 10.4 诊断偏差和方差 .................................................................................................. 167 10.5 正则化和偏差/方差 ............................................................................................ 169 10.6 学习曲线 .............................................................................................................. 171 10.7 决定下一步做什么 .............................................................................................. 173 十一、机器学习系统的设计(Machine Learning System Design) ....................................... 175 11.1 首先要做什么 ...................................................................................................... 175 11.2 误差分析 .............................................................................................................. 176 11.3 类偏斜的误差度量 .............................................................................................. 179 11.4 查准率和查全率之间的权衡 .............................................................................. 180 II
11.5 机器学习的数据 .................................................................................................. 182 第 7 周 .......................................................................................................................................... 186 十二、支持向量机(Support Vector Machines) ................................................................... 186 12.1 优化目标 .............................................................................................................. 186 12.2 大边界的直观理解 .............................................................................................. 193 12.3 数学背后的大边界分类(选修) ...................................................................... 199 12.4 核函数 1............................................................................................................... 206 12.5 核函数 2............................................................................................................... 208 12.6 使用支持向量机 .................................................................................................. 210 第 8 周 .......................................................................................................................................... 213 十三、聚类(Clustering) ........................................................................................................ 213 13.1 无监督学习:简介 .............................................................................................. 213 13.2 K-均值算法 ........................................................................................................... 216 13.3 优化目标 .............................................................................................................. 218 13.4 随机初始化 .......................................................................................................... 219 13.5 选择聚类数 .......................................................................................................... 220 十四、降维(Dimensionality Reduction) ............................................................................... 221 14.1 动机一:数据压缩 .............................................................................................. 221 14.2 动机二:数据可视化 .......................................................................................... 224 14.3 主成分分析问题 .................................................................................................. 225 14.4 主成分分析算法 .................................................................................................. 227 14.5 选择主成分的数量 .............................................................................................. 228 14.6 重建的压缩表示 .................................................................................................. 230 14.7 主成分分析法的应用建议 .................................................................................. 232 第 9 周 .......................................................................................................................................... 233 十五、异常检测(Anomaly Detection) ................................................................................. 233 15.1 问题的动机 .......................................................................................................... 233 15.2 高斯分布 .............................................................................................................. 235 15.3 算法...................................................................................................................... 236 15.4 开发和评价一个异常检测系统 .......................................................................... 238 15.5 异常检测与监督学习对比 .................................................................................. 239 15.6 选择特征 .............................................................................................................. 240 15.7 多元高斯分布(选修) ...................................................................................... 242 15.8 使用多元高斯分布进行异常检测(选修) ...................................................... 245 十六、推荐系统(Recommender Systems) ........................................................................... 248 16.1 问题形式化 .......................................................................................................... 248 16.2 基于内容的推荐系统 .......................................................................................... 250 16.3 协同过滤 .............................................................................................................. 252 16.4 协同过滤算法 ...................................................................................................... 254 16.5 向量化:低秩矩阵分解 ...................................................................................... 255 16.6 推行工作上的细节:均值归一化 ...................................................................... 257 第 10 周 ........................................................................................................................................ 258 十七、大规模机器学习(Large Scale Machine Learning) ..................................................... 258 17.1 大型数据集的学习 .............................................................................................. 258 III
17.2 随机梯度下降法 .................................................................................................. 259 17.3 小批量梯度下降 .................................................................................................. 260 17.4 随机梯度下降收敛 .............................................................................................. 261 17.5 在线学习 .............................................................................................................. 263 17.6 映射化简和数据并行 .......................................................................................... 265 十八、应用实例:图片文字识别(Application Example: Photo OCR) ................................ 266 18.1 问题描述和流程图 .............................................................................................. 266 18.2 滑动窗口 .............................................................................................................. 267 18.3 获取大量数据和人工数据 .................................................................................. 269 18.4 上限分析:哪部分管道的接下去做 .................................................................. 270 十九、总结(Conclusion)....................................................................................................... 271 19.1 总结和致谢 .......................................................................................................... 271 附件....................................................................................................................................... 273 1 常用的数学公式 ....................................................................................................... 273 IV
机器学习课程-第 1 周-引言(Introduction) 第 1 周 一、 引言(Introduction) 1.1 欢迎 参考视频: 1 - 1 - Welcome (7 min).mkv 第一个视频主要讲了什么是机器学习,机器学习能做些什么事情。 机器学习是目前信息技术中最激动人心的方向之一。在这门课中,你将学习到这门技术 的前沿,并可以自己实现学习机器学习的算法。 你或许每天都在不知不觉中使用了机器学习的算法每次,你打开谷歌、必应搜索到你需 要的内容,正是因为他们有良好的学习算法。谷歌和微软实现了学习算法来排行网页每次, 你用 Facebook 或苹果的图片分类程序他能认出你朋友的照片,这也是机器学习。每次您阅 读您的电子邮件垃圾邮件筛选器,可以帮你过滤大量的垃圾邮件这也是一种学习算法。对我 来说,我感到激动的原因之一是有一天做出一个和人类一样聪明的机器。实现这个想法任重 而道远,许多 AI 研究者认为,实现这个目标最好的方法是通过让机器试着模仿人的大脑学 习我会在这门课中介绍一点这方面的内容。 在这门课中,你还讲学习到关于机器学习的前沿状况。但事实上只了解算法、数学并不 能解决你关心的实际的问题。所以,我们将花大量的时间做练习,从而你自己能实现每个这 些算法,从而了解内部机理。 那么,为什么机器学习如此受欢迎呢?原因是,机器学习不只是用于人工智能领域。 我们创造智能的机器,有很多基础的知识。比如,我们可以让机器找到 A 与 B 之间的最短 路径,但我们仍然不知道怎么让机器做更有趣的事情,如 web 搜索、照片标记、反垃圾邮 件。我们发现,唯一方法是让机器自己学习怎么来解决问题。所以,机器学习已经成为计算 机的一个能力。 现在它涉及到各个行业和基础科学中。我从事于机器学习,但我每个星期都跟直升机飞 行员、 生物学家、很多计算机系统程序员交流(我在斯坦福大学的同事同时也是这样)和 平均每个星期会从硅谷收到两、三个电子邮件,这些联系我的人都对将学习算法应用于他们 1
机器学习课程-第 1 周-引言(Introduction) 自己的问题感兴趣。这表明机器学习涉及的问题非常广泛。有机器人、计算生物学、硅谷中 大量的问题都收到机器学习的影响。 这里有一些机器学习的案例。比如说,数据库挖掘。机器学习被用于数据挖掘的原因之 一是网络和自动化技术的增长,这意味着,我们有史上最大的数据集比如说,大量的硅谷公 司正在收集 web 上的单击数据,也称为点击流数据,并尝试使用机器学习算法来分析数据, 更好的了解用户,并为用户提供更好的服务。这在硅谷有巨大的市场。再比如,医疗记录。 随着自动化的出现,我们现在有了电子医疗记录。如果我们可以把医疗记录变成医学知识, 我们就可以更好地理解疾病。再如,计算生物学。还是因为自动化技术,生物学家们收集的 大量基因数据序列、DNA 序列和等等,机器运行算法让我们更好地了解人类基因组,大家都 知道这对人类意味着什么。再比如,工程方面,在工程的所有领域, 我们有越来越大、越 来越大的数据集,我们试图使用学习算法,来理解这些数据。另外,在机械应用中,有些人 不能直接操作。例如,我已经在无人直升机领域工作了许多年。我们不知道如何写一段程序 让直升机自己飞。我们唯一能做的就是让计算机自己学习如何驾驶直升机。 手写识别:现在我们能够非常便宜地把信寄到这个美国甚至全世界的原因之一就是当你 写一个像这样的信封,一种学习算法已经学会如何读你信封,它可以自动选择路径,所以我 们只需要花几个美分把这封信寄到数千英里外。 事实上,如果你看过自然语言处理或计算机视觉,这些语言理解或图像理解都是属于 AI 领域。大部分的自然语言处理和大部分的计算机视觉,都应用了机器学习。学习算法还广泛 用于自定制程序。每次你去亚马逊或 Netflix 或 iTunes Genius,它都会给出其他电影或产品或 音乐的建议,这是一种学习算法。仔细想一想,他们有百万的用户;但他们没有办法为百万 用户,编写百万个不同程序。软件能给这些自定制的建议的唯一方法是通过学习你的行为, 来为你定制服务。 最后学习算法被用来理解人类的学习和了解大脑。 我们将谈论如何用这些推进我们的 AI 梦想。几个月前,一名学生给我一篇文章关于最 顶尖的 12 个 IT 技能。拥有了这些技能 HR 绝对不会拒绝你。这是稍显陈旧的文章,但在这 个列表最顶部就是机器学习的技能。 在斯坦福大学,招聘人员联系我,让我推荐机器学习学生毕业的人远远多于机器学习的 毕业生。所以我认为需求远远没有被满足现在学习“机器学习”非常好,在这门课中,我希 望能告诉你们很多机器学习的知识。 在接下来的视频中,我们将开始给更正式的定义,什么是机器学习。然后我们会开始学 2
分享到:
收藏