美文网首页
scrapy步骤记录

scrapy步骤记录

作者: 天雨流芳hodo | 来源:发表于2019-08-21 15:12 被阅读0次

1.创建项目:scrapy startproject 项目名
如果是想在对应pycharm目录下创建,则在pycharm中选择-show in explorer,在需要创建项目的文件夹中打开cmd(shift+此处打开powershell)执行创建项目命令

2.创建爬虫,进入项目文件夹下(文件夹包含两个文件,其中为scrapy.cfg),cmd中运行
scrapy genspider 爬虫名 网站域名

    • 爬虫名不能与项目名相同
    • 网站域名是允许爬虫采集的域名,如 baidu.com

3.编写item字段(items.py文件)

4.编写爬虫程序:采集数据,翻页操作等

5.编写pipelins.py文件,存储数据,如:

def __init__(self):
    self.f = open("tencent.json","w")

def process_item(self, item, spider):
    line = json.dumps(dict(item)) + "\n"
    self.f.write(line)
    return item

def close_spider(self,spider):
    self.f.close()

6.设置setting文件

  • ROBOTSTXT_OBEY = False
  • 启用ITEM_PIPELINES
  • 如果是下载图片,在setting.py中新加IMAGES_STORE路径
IMAGES_STORE = "D:/test/"

7.进入项目目录命令行中运行爬虫
scrapy crawl 爬虫名

相关文章

  • scrapy步骤记录

    1.创建项目:scrapy startproject 项目名如果是想在对应pycharm目录下创建,则在pycha...

  • Mac 安装Scrapy

    刚学习完Python,准备使用Scrapy练习爬虫。记录一下,在Mac环境下安装Scrapy的步骤及初始工程。 打...

  • Scrapy框架总结

    一、Scrapy框架的使用步骤: 创建项目:scrapy startproject project_name cd...

  • Python 爬虫之Scrapy的安装

    一.Scrapy的介绍 下面主要介绍下Scrapy的安装步骤以及遇到的一些坑。 二.安装步骤 首先安装python...

  • scrapy爬虫基本使用

    @[toc] 产生步骤1 应用scrapy爬虫框架主要是编写配置型代码 产生步骤2 在工程中产生一个scrapy爬...

  • Scrapy框架步骤

    简单了解一下Scrapy框架于操作步骤 什么是Scrapy框架呢? scrapy是python下的数据爬取集框架,...

  • Scrapy+redis分布式爬虫(一、理论概念)

    scrapy的工作原理 scrapy工作的步骤如下图所示: spiders获取的requests通过engine交...

  • Scrapy的基本使用(一)

    产生步骤(一) 应用Scrapy爬虫框架主要时编写配置型代码 步骤1:建立一个Scrapy爬虫工程选取一个目录(G...

  • Scrapy 爬虫的基本使用

    1 Scrapy爬虫的第一个实例 产生步骤(1)应用 Scrapy 爬虫框架主要是编写配置型代码步骤1∶建立一个 ...

  • Scrapy的基本使用(三)——Scrapy爬虫的数据类型

    Scrapy爬虫的使用步骤步骤1:创建一个工程和Spider模板步骤2:编写Spider步骤3:编写Item Pi...

网友评论

      本文标题:scrapy步骤记录

      本文链接:https://www.haomeiwen.com/subject/ewcbsctx.html