美文网首页Web Scraper
webscraper 抓数据需求文档

webscraper 抓数据需求文档

作者: 明白1 | 来源:发表于2019-02-11 12:04 被阅读254次

一、如何判断自己要抓的东西爬虫能完成?

如果你要抓一个东西

  1. 你必须提供一个 网址(也可以叫链接、或者 URL),有了这个网址,我才能开始抓数据。

例如:http://www.zsxq100.com/

  1. 你需要把第一步提供的网站,放到浏览器的地址栏里访问一下,看看你要抓取的信息,能不能用眼睛看到。

如果能看到,那就 99% 能抓,如果看不到,那就抓不了。

二、抓数据需要提供的信息

为了提高沟通效率,下面这些信息请您认真查看

1、要抓取的网址链接。为什么要提供这个,参看第一点。
2、要抓取的信息字段,为了不产生歧义,需要截图标注清楚
3、如果有多页,要说明抓多少页

举例——
需求概述:小明要抓取淘宝上关于酸奶的商品信息。
需要提供:

  1. 网站链接 —— 如何获取?进入淘宝 www.taobao.com,然后搜索“酸奶”,出现的这个链接,就是爬虫需要的链接,结果链接如下:
    https://s.taobao.com/search?q=%E9%85%B8%E5%A5%B6&imgfile=&commend=all&ssid=s5-e&search_type=item&sourceId=tb.index&spm=a21bo.2017.201856-taobao-item.1&ie=utf8&initiative_id=tbindexz_20170306
image.png
  1. 需要抓取这个页面的所有商品,每个商品需要抓取的信息:
  • 产品名称
  • 价格
  • 购买人数

具体截图如下:

image.png
  1. 搜索结果一共有 100页,只需要抓取前 5 页即可。
image.png

ps:上面是个例子,具体情况,可以根据需求改变。比如抓取的字段不同,或者抓取页数不一样等

相关文章

  • webscraper 抓数据需求文档

    一、如何判断自己要抓的东西爬虫能完成? 如果你要抓一个东西 你必须提供一个 网址(也可以叫链接、或者 URL),有...

  • webscraper 抓数据需要的信息

    《不用写代码的爬虫课》发布后,有不少朋友来找我抓数据,但是有的朋友对于爬虫不了解,所以造成交流不畅。这篇文章就是分...

  • 如何写一份出色的数据需求文档

    一.什么是数据需求文档 数据需求文档简称DRD,英文全称Data Raquirements Document,工作...

  • WebScraper for Mac(网站内容抓取工具) v4.

    WebScraper Mac是Mac os系统上一款非常好用的网站数据提取工具,WebScraper可以帮您在10...

  • 新人必会的傻瓜式爬虫工具—WebScraper Mac 网页数据

    WebScraper Mac是Mac os系统上一款非常好用的网站数据提取工具,WebScraper可以帮您在10...

  • 需求文档

    需求分析文档一般放,软件背景,面向对象,数据概述,功能性需求,非功能需求。获取需求,分析需求,编写需求文档,评审需...

  • Aha上海第一次讨论会简要记录

    需求文档怎么写好 文档名称,修改历史 数据驱动-验证需求合理性,如何产生需求,需求论证 普通功能迭代-当前流程图修...

  • 数据产品需求文档模板

    项目或产品名称V1.0 一、背景及目的 请先思考是否有更好的解决方案,这个产品是否目前必须要做的,这个产品的价值有...

  • 数据产品经理

    工作职责: �负责客服部大数据产品,根据数据的应用场景,抽象数据需求,搭建数据模型,制作产品原型,编写需求文档; ...

  • 需求文档

    商业需求文档BRD、市场需求文档MRD、产品需求文档PRD、技术需求文档(需求规格说明书)。 商业需求文档BRD。...

网友评论

    本文标题:webscraper 抓数据需求文档

    本文链接:https://www.haomeiwen.com/subject/kqqqeqtx.html