Skip to content

Latest commit

 

History

History
48 lines (31 loc) · 4.55 KB

README.md

File metadata and controls

48 lines (31 loc) · 4.55 KB

PythonDataMining

FOSSA Status

在学院的书架上发现了一本不带脑子就能看懂的书《Python数据挖掘与实战》

推荐在nbviewer下加速浏览

  • pdf版的书在当前目录./下,分黑白图版彩图版

    • 体积略大(8.8Mb),谨慎点击,建议clonefork
  • 随书附带的代码在./BOOK_CODE文件夹下面,全英文

    • 原书有些数据集不包含在内,因为这些数据需要从其他网站上下载,而网站已经更新,书编写时的数据很难再找到
    • 有些数据还要翻墙才拿得到,比如第六章”使用朴素贝叶斯进行社交媒体挖掘”时,数据集需要通过twitterAPI来获取,要在代码里翻墙
    • 我根据书中的需要,一个一个重新把数据集找到,放到./data目录下
    • 懒得一个一个改随书附带的代码里面的路径,遂在随书附带的代码的基础上做了中文版
  • 阅读笔记在当前目录./

  • 知识点在笔记notes

  • 最后,厚着脸皮要 star ,嘤嘤嘤~~

笔记目录

  1. 数据挖掘流程简单示例10min.ipynb
  2. 用近邻算法分类.ipynb
  3. 用决策树预测获胜球队.ipynb
  4. 用亲和性分析推荐电影.ipynb
  5. 用转换器抽取特征.ipynb
  6. 用朴素贝叶斯进行社会媒体挖掘.ipynb
  7. 用图挖掘找到感兴趣的人.ipynb
  8. 用神经网络破解验证码.ipynb
  9. 作者归属问题.ipynb
  10. 新闻语料分类.ipynb
  11. 用深度学习进行图象分类.ipynb
  12. 大数据处理.ipynb

问题解决记录

  1. Python Tweepy 翻墙抓取Twitter信息

License

FOSSA Status