涉及到的内容包括:
一、监督学习算法
。适用于具有带标签的数据和样本的,例如:
线性回归
(Linear Regression)逻辑回归
(Logistics Regression)神经网络
(Neural Network)支持向量机(SVM)
二、无监督学习
。例如
- 聚类算法
K-Means
DBScan
- 数据降维
主成分分析(PCA)
异常检测算法
:适用于只有无标签数据 x(i) 时
三、机器学习特别的话题
推荐系统
大规模机器学习系统
,包括MapReduce
和并行系统
- 特别的应用
滑动窗口分类算法
:用于CV技术
四、关于构建机器学习系统的实用建议
-
理解机器学习算法是否正常工作的原因
偏差
(Bias)和方差
(Variance)
-
正则化
(Generalization) -
怎样决定接下来怎么做的问题
- 也就是说当你在开发一个机器学习系统时,什么工作才是接下来应该优先考虑的问题。
-
学习算法的评价法。比如:
混淆矩阵
(Confusion Matrix)查准率
(Precision rate)
召回率
(Recall rate)F1分数
(F1 Score)
-
数据集合划分
训练集
(Training Set)交叉验证集
(Valiadtion Set)测试集
(Test Set)
-
学习算法的调试,一些诊断法,比如
学习曲线
(Learning Rate)误差分析
(Error Analysis)天花板分析
(Ceiling Analysis)
所有这些工具都能有效地指引你决定接下来应该怎样做,让你把时间用在刀刃上。
以下来自Andrew Ng的原话,送给你:
如果你跟着课程一路走来,到现在,你应该已经感觉到自己已经成为机器学习方面的专家了吧?
机器学习是一门对科技、工业产生深远影响的重要学科,而现在,你已经完全具备了应用这些机器学习工具来创造伟大成就的能力。希望你能在相应的领域,应用所学的机器学习工具,构建出完美的机器学习系统,开发出无与伦比的产品和应用。 并且也希望你通过应用机器学习,不仅仅改变自己的生活,有朝一日,还要让更多的人生活得更加美好!
希望你们能从机器学习的学习中有所收获!
如果这里的内容有帮到你,欢迎在GitHub代码库点赞;如果有发现错误,亦请在Github直接提交Issue或Pull Request,谢谢。