8. xpath - 58房源信息爬取

作者: 薛东弗斯 | 来源:发表于2024-02-26 00:04 被阅读0次

【爬虫】-005-MongoDB数据库操作-练习
Python 实战计划学习笔记：自动设置代理爬取58同城商品信息
打卡：1-3爬取真实的网络数据
分布式爬虫scrappy-redis抓取房天下数据
爬虫代码集
第三节练习项目：爬取租房信息
Python实战课程1-3练习：爬取租房信息
python爬虫系列之数据的存储（一）：json库的使用
爬一爬链家网北京租房数据
Python 爬虫实战计划：第一周实战作业

image.png

# 需求：爬取58二手房中房源信息
import requests
from lxml import etree
if __name__=="__main__":
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) '
                      'AppleWebKit/537.36 (KHTML, like Gecko) '
                      'Chrome/96.0.4664.45 Safari/537.36'
    }
    # 爬取到页面源码数据
    url = 'https://bj.58.com/ershoufang/'
    page_text = requests.get(url=url,headers=headers).text

    # 数据解析
    tree = etree.HTML(page_text)
    # 存储的就是li标签对象
    li_list = tree.xpath('//url[@class="house-list-wrap"]/li')
    fp = open('58.txt','w',encoding='utf-8')
    for li in li_list:
        # 局部解析
        title = li.xpath('./div[2]/h2/a/text()')[0]
        print(title)
        fp.write(title+'\n')

【爬虫】-005-MongoDB数据库操作-练习
目标爬取小猪短租房源信息，暂定爬取前三页列表页爬取信息为房源的URL房源的价格将爬取的信息存入到数据库数据...
Python 实战计划学习笔记：自动设置代理爬取58同城商品信息
案例目的：爬取58同城宠物狗信息难点 - 自动代理：爬取58信息前，自动设置 http://www.xicidai...
打卡：1-3爬取真实的网络数据
【要爬取的数据来源】 ❤在列表页爬取详细介绍的网址❤在详细介绍爬取房源具体信息：标题、地址、价格、第一幅图片、房主...
分布式爬虫scrappy-redis抓取房天下数据
分布式爬虫scrapy-redis来爬取房天下的各个省份的房源信息（新房和二手房房源信息）newhouse.jso...
爬虫代码集
一、简单爬取猫眼(使用字符串) 二、简单爬取豆瓣(使用XPATH) Beautiful Soup爬取
第三节练习项目：爬取租房信息
爬虫实战第二天任务爬取小猪短租杭州地区的房源信息：成果共爬取284条信息，并保存到.xls文件中，写入时还...
Python实战课程1-3练习：爬取租房信息
前面写了自己的本地网页并爬取，然后就真枪实战地爬取真实网站了。这节的练习项目是爬取房源的详细信息（北京短租房）。分...
python爬虫系列之数据的存储（一）：json库的使用
在上一篇文章里我们讲了 xpath写法的问题还以爬取我的文章信息写了示例，但是在上一篇中我们只是爬取并打印了信息，...
爬一爬链家网北京租房数据
目的爬取链家网租房信息，对北京市各个区域房源量、租房价格、房屋面积有个大致的分析了解欲爬取以下信息，使用Scra...
Python 爬虫实战计划：第一周实战作业
要求：1. 爬取58同城转转二手交易平台商品信息 http://bj.58.com/pbdn/0/2. 爬取每一页...

网友评论

本文标题：8. xpath - 58房源信息爬取

本文链接：https://www.haomeiwen.com/subject/uxuoadtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

8. xpath - 58房源信息爬取

相关文章

【爬虫】-005-MongoDB数据库操作-练习

Python 实战计划学习笔记：自动设置代理爬取58同城商品信息

打卡：1-3爬取真实的网络数据

分布式爬虫scrappy-redis抓取房天下数据

爬虫代码集

第三节练习项目：爬取租房信息

Python实战课程1-3练习：爬取租房信息

python爬虫系列之数据的存储（一）：json库的使用

爬一爬链家网北京租房数据

Python 爬虫实战计划：第一周实战作业

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读