干货一份详实的Scrapy爬虫教程

看白癜风的医院哪比较好 https://yyk.39.net/hospital/89ac7_labs.html

大家好,我是菜鸟哥!

之前分享了很多requests、selenium的Python爬虫文章,本文将从原理到实战带领大家入门另一个强大的框架Scrapy。如果对Scrapy感兴趣的话,不妨跟随本文动手做一遍!

一、Scrapy框架简介Scrapy是:由Python语言开发的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据,只需要实现少量的代码,就能够快速的抓取。

二、运行原理Scrapy框架的运行原理看下面一张图就够了(事实上原理是比较复杂的,也不是三言两语能够说清楚的,因此感兴趣的读者可以进一步阅读更多的相关文章来了解,本文不做过多讲解)

Scrapy主要包括了以下组件:

引擎(ScrapyEngine)Item项目调度器(Scheduler)下载器(Downloader)爬虫(Spiders)项目管道(Pipeline)下载器中间件(DownloaderMiddlewares)爬虫中间件(SpiderMiddlewares)调度中间件(SchedulerMiddewares)三.入门3.1安装第一种:在命令行模式下使用pip命令即可安装:

pipinstallscrapy第二种:首先下载,然后再安装:

pipdownloadscrapy-d./#通过指定国内镜像源下载pipdownload-i


转载请注明:http://www.aierlanlan.com/rzdk/923.html