scrapy步骤记录

作者: 天雨流芳hodo | 来源:发表于2019-08-21 15:12 被阅读0次

scrapy步骤记录
Mac 安装Scrapy
Scrapy框架总结
Python 爬虫之Scrapy的安装
scrapy爬虫基本使用
Scrapy框架步骤
Scrapy+redis分布式爬虫(一、理论概念)
Scrapy的基本使用（一）
Scrapy 爬虫的基本使用
Scrapy的基本使用（三）——Scrapy爬虫的数据类型

1.创建项目：scrapy startproject 项目名
如果是想在对应pycharm目录下创建，则在pycharm中选择-show in explorer,在需要创建项目的文件夹中打开cmd（shift+此处打开powershell）执行创建项目命令

2.创建爬虫，进入项目文件夹下（文件夹包含两个文件，其中为scrapy.cfg），cmd中运行
scrapy genspider 爬虫名网站域名

- 爬虫名不能与项目名相同
- 网站域名是允许爬虫采集的域名，如 baidu.com

3.编写item字段(items.py文件)

4.编写爬虫程序：采集数据，翻页操作等

5.编写pipelins.py文件，存储数据，如：

def __init__(self):
    self.f = open("tencent.json","w")

def process_item(self, item, spider):
    line = json.dumps(dict(item)) + "\n"
    self.f.write(line)
    return item

def close_spider(self,spider):
    self.f.close()

6.设置setting文件

ROBOTSTXT_OBEY = False
启用ITEM_PIPELINES
如果是下载图片，在setting.py中新加IMAGES_STORE路径

IMAGES_STORE = "D:/test/"

7.进入项目目录命令行中运行爬虫
scrapy crawl 爬虫名

网友评论

本文标题：scrapy步骤记录

本文链接：https://www.haomeiwen.com/subject/ewcbsctx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

scrapy步骤记录

相关文章

scrapy步骤记录

Mac 安装Scrapy

Scrapy框架总结

Python 爬虫之Scrapy的安装

scrapy爬虫基本使用

Scrapy框架步骤

Scrapy+redis分布式爬虫(一、理论概念)

Scrapy的基本使用（一）

Scrapy 爬虫的基本使用

Scrapy的基本使用（三）——Scrapy爬虫的数据类型

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读