什么是爬虫?

爬虫，英文spider，即网络爬虫，大家可以理解为在网络上爬行的一只蜘蛛。互联网就好比一张大网，而爬虫便是在这张网上爬来爬去的蜘蛛，如果它遇到资源（例如小说,文本,电影等），那么它就会抓取下来。至于想抓取什么取决于我们的代码怎么设计。

比如它在抓去一个网页上的图片，蜘蛛在网页这张大网中找到了图片的连接地址，那么它就可以爬取图片地址对应的图片并下载到本地，如果网页中存在其它网址（例如其它分类），那么蜘蛛可以通过该网址继续访问下一个网页的相关数据，直到没有数据为止。