Skip to content

bannima/MachineLearninginAction

Repository files navigation

Machine Learning Models in Action 机器学习实践专题

主要根据李航老师《统计学习方法》,仔细梳理主流机器学习模型,编码实现。 具体涵盖以下方法:

  • 第1章 统计学习方法概论

  • 第2章 感知机

  • 第3章 k近邻法

  • 第4章 朴素贝叶斯

  • 第5章 决策树

    • 5.1 ID3

      基于信息增益作为生成决策树的准则。

    • 5.2 C4.5

      基于信息增益比作为生成决策树的准则。

    • 分类与回归树,基于二叉树,可分类也可回归。

  • 第6章 逻辑斯蒂回归与最大熵模型

  • 第7章 支持向量机

  • 第8章 提升方法

    • boosting家族中具有代表性的方法一种,基于前向加法模型,基本学习器为基本分类器,只能处理二分类问题,可看作GBDT的特例, 此时基础学习器为基本分类器,损失函数为指数函数。

    • Bagging的代表性算法,基于样本随机采样(行采样)和部分特征采样(列采样),根据基础决策树不同,可分别用于回归或者二分类、多分类问题。

    • 梯度提升分类树和梯度提升回归树。 基于前向加法模型,基本学习器采用决策树,可解决分类以及回归问题,加法模型每一步都在拟合损失函数的负梯度。

  • 第9章 EM算法及其推广

  • 第10章 隐马尔可夫模型

  • 第11章 条件随机场

  • 第12章 统计学习方法总结

  • 第13章 无监督学习概论

  • 第14章 聚类方法

    • 14.1 K-Means

    • 14.2 Hierarchical Cluster

    • 14.3 DBSCAN

  • 第15章 奇异值分解

  • 第16章 主成分分析

  • 第17章 潜在语义分析

  • 第18章 概率潜在语义分析

    • 19.1 Metropolis-Hasting

    • 19.2 Gibbs

  • 第20章 潜在狄利克雷分配

  • 第21章 PageRank算法

  • Appendix

    • 1 DNN

    • 2 CNN(coming soon)

    • 3 RNN

      • 3.1 LSTM(coming soon)

参考资料

1 《统计学习方法》李航 第二版

2 《机器学习实战》

3 《机器学习》周志华

About

Machine Learning Models in Action

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages