Skip to content

Latest commit

 

History

History
15 lines (12 loc) · 868 Bytes

README.md

File metadata and controls

15 lines (12 loc) · 868 Bytes

crawler

code about scrapying image of baidu 通过在书本上的知识去实践一个爬虫项目 刚开始就以为在百度上面直接查看源码,找到固定的tag,然后直接利用urllib.request.urlopen 打开,再利用BeautifulSoup解析一下就可以找了 结果发现根本找不到,然后就想到了正则表达式, 发现也没有找到 但是明明在源码上面看到了具体位置 此时就开始去各个网站查询原因,经过一番辛苦之后, 才发先自己被浏览器给骗了 百度图片利用的是瀑布流的方式实施加载图片,所有请求过去了,根本没有图片,

对于处理这个问题,在一位博主的文章下我看到了和我相似的问题 然后就开始按照博主的思路开始一个个问题查询解决, 最后把把这个项目解决了

读书和实践必须要齐头并进