当前位置:主页 > 软件编程 > Python代码 >

Python爬虫部分开篇概念讲解

时间:2021-10-03 17:01:24 | 栏目:Python代码 | 点击:

在学习Python爬虫部分,需要你已经学过Python基础和前端的相关知识。

开发环境介绍:

数据的来源及作用

数据的来源有哪些?

数据的作用

 爬虫的相关概念

 a) 爬虫的概念

爬虫就是应用程序,从网上下载各种各样的资源。
换句话说就是使用编程语言编写一个用于爬虫web或者app的数据应用程序。
怎么爬取数据呢?

爬虫什么数据都可以爬吗?
当然不能,需要遵守一定的规则和协议

可以看一下京东的:

在这里插入图片描述

有些是允许的,有些是不允许的。

b) 爬虫分类

百度等搜索引擎,从一些初始的URL扩展到整个网站,主要为门户站点搜索引起和大型网站服务采集数据

主题网络爬虫,选择性爬取根据需求相关的页面的网络爬虫

对已经下载的页面采取更新知识和只爬新产生的。

c) 爬虫的原理

在这里插入图片描述

在这里插入图片描述 

d) 各种语言写爬虫的对比

您可能感兴趣的文章:

相关文章