美文网首页
python爬虫学习(1)

python爬虫学习(1)

作者: 乐乐宝贝来了2019 | 来源:发表于2020-06-02 11:19 被阅读0次

1、认识网页结构,分别是html(超文本标记语言)、css(层叠样式表)和JScript(活动脚本语言)。

HTML

html是整个网页的结构,相当于整个网站的框架,带"<",">"都是属于html标签,并且标签是成对出现的。

常见标签如下:

<html>...</html>表示标记中间的元素是网页

<body>...</body>表示用户可见的内容

<div>...</div>表示框架

<p>...</p>表示段落

<li>...</li>表示列表

<img>...</img>表示图片

<title>...</title>表示标题

<a href=" ">...</a>表示超链接

2、以中国旅游网首页(http://www.cntour.cn/)为例,抓取中国旅游网首页首条信息(标题和链接),数据以明文的形式出面在源码中。可以在网页空白处右击选择查看网页源代码,或者ctrl+U,如下图所示

网页源码

CSS

css表示样式,图中的第13行<style type="text/css">表示下面引用一个css,在css种定义了外观

Jscript

Jscript表示功能,交互的内容合入各种特效都在Jscript种,Jscript描述了网站种的各种功能。

如果用人体来比喻,HTML 是人的骨架,并且定义了人的嘴巴、眼睛、耳朵等要长在哪里。CSS 是人的外观细节,如嘴巴长什么样子,眼睛是双眼皮还是单眼皮,是大眼睛还是小眼睛,皮肤是黑色的还是白色的等。JScript 表示人的技能,例如跳舞、唱歌或者演奏乐器等。

简单的html示例:

html示例

在编辑器中写好后保存为html格式的文档,然后用浏览器打开,效果图如下

示例效果图

参考文章:http://c.biancheng.net/view/2011.html

相关文章

网友评论

      本文标题:python爬虫学习(1)

      本文链接:https://www.haomeiwen.com/subject/zjxnfhtx.html