美文网首页
1217班1-3自己搜小猪家乡

1217班1-3自己搜小猪家乡

作者: 木马音响积木 | 来源:发表于2016-11-30 22:58 被阅读0次

总结:几乎用了一个晚上,才搞定,很慢,但有收获,终于小猪的数据来了。另外,这次终于在ubuntu下搞定的
成果

20161130.PNG

我的代码如下

#!usr/bin/python3
#-*- coding: utf-8 -*-

from bs4 import BeautifulSoup
import requests

def get_lorder_sex(nannv):
    if nannv==['member_ico1']:
        return 'nv'
    else:
        return 'yemen'

def get_links(url):
    web_data=requests.get(url) #come in
    soup=BeautifulSoup(web_data.text,'lxml')
    links = soup.select('a.resule_img_a')
    for link in links:
        href = link.get("href")
        get_detail(href)

def get_detail(url):
    web_data2=requests.get(url) # use 2 for different
    soup=BeautifulSoup(web_data2.text,'lxml')

    titles  =soup.select("body > div.wrap.clearfix.con_bg > div.con_l > div.pho_info > h4 > em")
    #body > div.wrap.clearfix.con_bg > div.con_l > div.pho_info > h4 > em
    #body > div.wrap.clearfix.con_bg > div.con_l > div.pho_info > h4 > em
    addrs   =soup.select("body > div.wrap.clearfix.con_bg > div.con_l > div.pho_info > p > span")
    #body > div.wrap.clearfix.con_bg > div.con_l > div.pho_info > p > span
    prices  =soup.select("#pricePart > div.day_l > span")
    ##pricePart > div.day_l > span
    images  =soup.select("#curBigImage")
    ##imgMouseCusor
    #![](https://img.haomeiwen.com/i3861610/082d00105572764e.jpg?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
    avartars=soup.select("#floatRightBox > div.js_box.clearfix > div.member_pic > a > img")
    ##floatRightBox > div.js_box.clearfix > div.member_pic > a > img

    names   =soup.select("#floatRightBox > div.js_box.clearfix > div.w_240 > h6 > a")
    ##floatRightBox > div.js_box.clearfix > div.w_240 > h6 > a
    sexs    =soup.select("#floatRightBox > div.js_box.clearfix > div.w_240 > h6 > span")
    ##floatRightBox > div.js_box.clearfix > div.member_pic > div
    ##floatRightBox > div.js_box.clearfix > div.member_pic > a > img
    ##floatRightBox > div.js_box.clearfix > div.w_240 > h6 > span
    print(titles)



    for title,addr,price,image,avartar,name,sex in zip(titles,addrs,prices,images,avartars,names,sexs):
        data={
            "title"  :title.get_text(),
            "addr"   :addr.get_text(),
            "price"  :price.get_text(),
            "image"  :image.get("src"),
            "avartar":avartar.get("src"),
            "name"   :name.get_text(),
            "sex"    :get_lorder_sex(sex.get("class")) #into func change to txt
        }
        print(data)

urls=["http://yantai.xiaozhu.com/penglai-duanzufang-p{}-8/".format(i) for i in range(1,7)]
for one_url in urls:
    get_links(one_url)





'''
#the first test coding
url='http://yantai.xiaozhu.com/penglai-duanzufang-8/'
web_data= requests.get(url)
soup=BeautifulSoup(web_data.text,'lxml')

titles = soup.select('a.resule_img_a')

#print(titles)

for title in titles:
    link=title.get("href")

    print(link)


'''






相关文章

  • 1217班1-3自己搜小猪家乡

    总结:几乎用了一个晚上,才搞定,很慢,但有收获,终于小猪的数据来了。另外,这次终于在ubuntu下搞定的成果 我的...

  • 家乡冲上热搜

    一觉醒来,没想到我的家乡冲上热搜了。我还不知道今天我们村里的政策是什么呢。 其实我们不是完全放开了,真的是间接性的...

  • 亲子日常对话

    最近小猪佩奇有点火,昨晚上小米缠着让我在她的画板上画一个小猪佩奇。 作为绘画天赋为0的爸爸赶紧偷偷搜了一下小猪佩奇...

  • 你发现了吗?《小猪佩奇》里居然藏着育儿的葵花宝典?

    小猪佩奇一家人一起跳泥坑 微博,百度,搜狗的热搜,“小猪佩奇”又在朋友圈刷屏了,只是这次,不再是因为“小猪佩奇身上...

  • 寒假第一天

    桐宝贝阅读《小猪唏哩呼噜》第1-3页,从中知道了猪妈妈生了12个孩子,其中女孩11个,男孩1个,这个男孩就...

  • 佩奇:粉色的温情

    有一只粉色的小猪,它叫佩奇,深受孩子的喜欢,每天都要看看它。 可就是这只粉色的小猪,一夜之间全民皆知,上了热搜。 ...

  • 助人为乐 -

    从前有一只小猪叫小猪佩奇,小猪佩奇非常的自私。东西都是自己吃的,别人要是想要小猪佩奇帮助自己,小猪佩奇都是一口拒绝...

  • 助人为乐

    从前有一只小猪叫小猪佩奇,小猪佩奇非常的自私。东西都是自己吃的,别人要是想要小猪佩奇帮助自己,小猪佩奇都是一口拒绝...

  • 罗志祥劈腿,毁灭的源头,站着一个溺爱孩子的母亲

    最近的每一天,除了关心疫情的进展情况,还有就是每天“被迫”被小猪罗志祥的出轨刷屏。从每一天的热搜榜单看,小猪的火爆...

  • 明白许多大道理,却仍然过不好这一生

    有只小猪,出生几个月后就离开了家乡,辗转过几个地方终于安家落户了,小猪很难过,可是新主人对它很好,一日三餐,顿顿不...

网友评论

      本文标题:1217班1-3自己搜小猪家乡

      本文链接:https://www.haomeiwen.com/subject/ejztmttx.html