selenium的学习与使用(包括爬取魔网的音乐、浏览器截图与图片简单识别、chrome淘宝自动登录、firefox淘宝自动登录、贴吧自动化、GD题库爬取)
一、代码说明
1.moresound.py为爬取魔声网站周杰伦的全部歌曲(网页源码多重加密,因此采用selenium,结果网站被攻击,限制访问频率,因此作罢)
2.seleniump1.py为用chrome实现淘宝自动登录,包括模拟人手动滑动滑块和抓包改请求头
3.seleniump2.py为用火狐浏览器实现淘宝自动登录
4.seleniump3.py为实现贴吧自动化,包括贴吧自动登录、自动关注、自动签到、自动发帖
5.seleniump5.py为爬取高顿题库,CMA英文part1和part2
6.tesseractp1.py为实现浏览器截图,并简单识别图片文字