2024年科普:爬虫
爬虫是什么:现在人们说的python写爬虫啊之类的,爬虫当然不是普通的那个爬虫,而是指按照一定的规则获取网络上信息的程序,因为它在获取一个网页信息的同时会从这个网页上获得url然后再对这个url获取信息,所以称为爬虫。爬虫的分类:爬虫之间也有不同,不过大致可以分为以下几类通用爬虫:这类爬虫的目标从几个URL扩展到整个网络,一般用于为搜索引擎和Web服务提供商采集数据。这类爬虫不太看重页面间的联系,而看重获得页面的数量,因此对存储空间有一定要求。聚焦爬虫:这类爬虫主要根据选定好的