主要根据李航老师《统计学习方法》,仔细梳理主流机器学习模型,编码实现。 具体涵盖以下方法:
-
-
2.1 感知机
-
-
-
5.1 ID3
基于信息增益作为生成决策树的准则。
-
基于信息增益比作为生成决策树的准则。
-
5.3 CART分类树和CART回归树
分类与回归树,基于二叉树,可分类也可回归。
-
-
-
8.1 Adaboost
boosting家族中具有代表性的方法一种,基于前向加法模型,基本学习器为基本分类器,只能处理二分类问题,可看作GBDT的特例, 此时基础学习器为基本分类器,损失函数为指数函数。
-
8.2 Random Forest
Bagging的代表性算法,基于样本随机采样(行采样)和部分特征采样(列采样),根据基础决策树不同,可分别用于回归或者二分类、多分类问题。
-
8.3 GBDT和GBRT
梯度提升分类树和梯度提升回归树。 基于前向加法模型,基本学习器采用决策树,可解决分类以及回归问题,加法模型每一步都在拟合损失函数的负梯度。
-
-
- Conditional Random Field 条件随机场 利用梯度下降学习参数,用维特比算法进行序列预测, 并用中文分词实验中检验结果。
-
-
第19章 马尔可夫链蒙特卡罗法
-
1 神经网络
-
1 DNN
-
-
-
-
1 Word2Vec
-
1 《统计学习方法》李航 第二版
2 《机器学习实战》
3 《机器学习》周志华