爬虫是什么

来源：考驾照网更新时间：2020-11-12 00:00

网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本，它们被广泛用于互联网搜索引擎或其他类似网站，可以自动采集所有其能够访问到的页面内容，以获取或更新这些网站的内容和检索方式。从功能上来讲，爬虫一般分为数据采集，处理，储存三个部分。

Web网络爬虫系统的功能是下载网页数据，为搜索引擎系统提供数据来源，很多大型的网络搜索引擎系统都是基于Web数据采集的搜索引擎系统，由此可见Web网络爬虫在搜索引擎中的重要性。

在网络爬虫的系统框架中，主过程由控制器、解析器、资源库三部分组成。控制器的主要工作是负责给多线程中各个爬虫线程分配工作任务；解析器的主要工作是下载网页，进行网页的处理，处理的内容包括JS脚本标签、CSS代码内容、空格字符、HTML标签等内容。资源库是用来存放下载到的网页资源，一般会采用大型的数据库存储，并对其建立索引。

考驾照网【KaoJiaZhao.COM】

免责声明：本文仅代表作者个人观点，与本站无关。其原创性以及文中陈述文字和内容未经本站证实，如果侵犯了您的版权，请联系我们，本站将在3个工作日内删除。

上一篇:油改气的轿车平时如何驾驶 下一篇:惠安开成职校有哪些专业呢

2025年小车科目一模拟试题

模拟考试

2025年小车科目四模拟试题

模拟考试

热门城市驾校

今日热门文章

2022-06-28天津换车原车牌怎么办_上… 2022-06-2820车辆购置税多少_车辆… 2022-06-28办etc需要交路桥费吗_… 2022-06-2815的车辆购置税是多少_… 2022-06-2814万车辆购置税是多少_… 2022-06-28在深圳买车需要社保吗_上… 2022-06-2813t的车辆购置税是多少… 2022-06-288万车辆的购置税是多少_…

考驾照网（www.kaojiazhao.com） 旗下平台：驾校平台教练平台陪练平台考试平台

考驾照网举报投诉方式：电话： QQ：邮箱：（接受色情、低俗、侵权、虐待等违法和不良信息的投诉）