美文网首页
selenium初认识

selenium初认识

作者: 刘年 | 来源:发表于2020-03-24 16:20 被阅读0次

1 安装selenium和foxi

利用 启动百度网页

两种方式
注意,一个很重要的东西,webdriver.Firefox一定不能写成webdriver.firefox
小写会出错

  • 1
    将驱动放在任意非中文字符目录下,启动即可
from selenium import webdriver
import time
driver_path =r"C:\Drivers\firefox\geckodriver.exe"
driver =webdriver.Firefox(executable_path=driver_path)
driver.get('http://www.baidu.com')
#页面关闭
#设置5秒以后关闭
time.sleep(5)
driver.close()
#浏览器关闭
# driver.quit()
  • 2 打开网页
    将驱动程序放在python程序Scripts文件夹里,即可以不用设置路径,默认打开
from selenium import webdriver
import time
driver = webdriver.Firefox()
driver.get("https://www.baidu.com")
#页面关闭
#设置5秒以后关闭
time.sleep(5)
driver.close()
#浏览器关闭
# driver.quit()

  • 3 在数据框中输入数据
from selenium import webdriver
import time
driver = webdriver.Firefox()
driver.get("https://www.baidu.com")

# inputtag = driver.find_element_by_class_name('s_ipt')
inputtag = driver.find_element_by_xpath('//input[@id="kw"]')

inputtag.send_keys('python')
image.png
主要分为两类方法,找标签属性法,或者用xpath或css选择法
  • 4 得到网页源代码进行分析抓取
    如果只是进行抓取数据分析的话,建议还是用lxml xpath,速度比较快
from selenium import webdriver
from lxml import etree
import time
driver = webdriver.Firefox()
driver.get("https://www.baidu.com")
text = driver.page_source
HTMl =etree.HTML(text)
print(type(text))
print(type(HTMl))

结果

<class 'str'>
<class 'lxml.etree._Element'>
  • 5 操作表单
  • 5.1 提交数据
from selenium import webdriver


profile_directory = r'C:\Users\Administrator\AppData\Roaming\Mozilla\Firefox\Profiles\66c0hw86.sss'

profile = webdriver.FirefoxProfile(profile_directory)
driver = webdriver.Firefox(profile)
driver.get("https://www.baidu.com")
#找到要填写的表单
inputtag = driver.find_element_by_name('wd')
#填写要搜索的内容
inputtag.send_keys('python')
#找到要点击的按钮
submittag = driver.find_element_by_id('su')
#点击按钮
submittag.click()

其中关于selenium+python+firefox解决不安全连接的方法,请参考文章selenium+python+firefox解决不安全连接的方法

  • 5.2 下拉选择
from selenium import webdriver
#处理下拉选择一定要用这个类
from selenium.webdriver.support.ui import Select

profile_directory = r'C:\Users\Administrator\AppData\Roaming\Mozilla\Firefox\Profiles\66c0hw86.sss'
profile = webdriver.FirefoxProfile(profile_directory)
driver = webdriver.Firefox(profile)
#暂时找不到例子,内容不完整
driver.get("      ")
selectBN = Select(driver.find_element_by_name(""))
selectBN.select_by_index('')

相关文章

  • selenium初认识

    1 安装selenium和foxi 利用 启动百度网页 两种方式注意,一个很重要的东西,webdriver.F...

  • 用Selenium抢会议室(二):使用IDE录制脚本

    认识Selenium IDE 前面介绍Selenium时已经提到了,selenium IDE是Firefox的一个...

  • 2021-04-08 Selenium元素定位实战

    认识Selenium Selenium 是一个用于Web 应用程序的自动化测试工具。Selenium 直接运行在浏...

  • Robot Framework之Selenium2Library

    一、认识Selenium2Library Selenium 自动化测试工具,它主要是用于 Web 应用程序的自动化...

  • 分子初认识

    十万亿亿个分子, 小小的水滴一滴。 小小的水滴一滴, 分子数十万亿亿! 不可思议! 不可思议! 这分子小的不可思议...

  • WebSocket初认识

    首先我们来看个典型的Websocket握手(借用Wikipedia的。。) 熟悉HTTP的童鞋可能发现了,这段类似...

  • 水彩初认识

    当我拿起画笔时,我的内心是静的。 那些美妙的线条,那些变幻的色彩,让我沉迷。 有时候,我也会考虑周围人的感受:我的...

  • jquery初认识

    学习js,那你就不能不了解jquery库,它是一个快速、小型的、特性很多的JS库,完美地解决了选择元素难、样式难、...

  • 期权初认识

    虽然我不是第一次接触到期权这个词,但在这之前我对期权这东西确实是一无所知的,看到这个词,首先让我联想到的是投资品中...

  • ARKit初认识

    ARKit 是苹果 WWDC2017 中发布的用于开发iOS平台 AR 功能的框架。AR 全称 Augmented...

网友评论

      本文标题:selenium初认识

      本文链接:https://www.haomeiwen.com/subject/eczbehtx.html