HTML基础
如果把HTML的学习依序分为三个层次的话,应该是读懂、修改、编写。
【读懂】:只有读懂了HTML,我们才能看得懂网页结构,才有可能运用Python的其他模块去解析数据和提取数据。所以想写爬虫程序的话,一定要先学好HTML基础。
【修改】:在读懂HTML文档的基础上,学会修改HTML代码,是可以做些有趣的事情的,比如修改微博。
【编写】:如果达到了这个水平,那就可以去应聘前端工程师了,这是专业的程序员水平了。
HTML是什么?
HTML(Hyper Text Markup Language)是用来描述网页的一种语言,也叫超文本标记语言 。
打个比方就更好理解了,HTML之于网页就好比建筑图纸之于建筑。
建筑图纸是建筑师设计房子时使用的语言,工匠会根据图纸内容,修建出它所描述的房子。
而HTML文档就是前端工程师设计网页时使用的语言,浏览器会根据HTML文档的描述,解析出它所描述的网页。
我们讲到向浏览器中输入某个网址后,浏览器会向服务器发出请求,然后服务器就会作出响应。其实,服务器返回给浏览器的这个结果就是HTML代码了。
而紧接着,浏览器会根据这个HTML代码,解析成我们所能看见的漂亮的网页。
Windows系统的电脑可以使用快捷键ctrl+u来查看网页源代码;
这样查看的好处是,整个网页的源代码都完整地呈现在你面前。坏处是,在大部分情况下,它都会经过压缩,导致结构不够清晰,你不太容易懂每行代码的含义。而且,源代码和网页分开在两个页面展示。
所以更多时候,我们会用这样一种方法:在网页的空白处点击右键,然后选择“检查”(快捷方式是ctrl+shift+i)。
会看到一个新的界面——开发者工具栏:
将鼠标放在HTML源代码上,你会发现,左边网页上有一些内容会被标亮。这其实就是这行代码所描述的网页内容,它们一左一右,相互对应。
HTML的层级
先以房子为例:房子由不同楼层所组成,每一层中,都会包含一些房间,一个房间还可能划分为几个更小的房间,每个房间又是由门、窗、墙壁、地板等等构建组成的。
那么相对应的,建筑图纸也是由不同楼层的设计图所组成,而在每层楼的图纸中,又都详细描述了每个房间大小,以及门、窗的位置、尺寸、样式等等。
HTML源代码之于网页,就像建筑图纸之于房子,会有鲜明的层级结构,以及互相对应的关系。
仔细看开发者工具栏:可以看到,HTML源代码中有一些小三角形,每一个三角形都可以展开或合上。尖角向下代表展开,向右代表合上了,这就是HTML的层级关系。
HTML
HTML的组成:
标签和元素
首先,我们一起看个最简单的HTML文档,感受一下。
标签
可以看到很多夹在尖括号<>中间的字母,它们叫做【标签】。
标签通常是成对出现的:前面的是【开始标签】,比如<body>;后面的是【结束标签】,如</body>。
不过,也有标签是形单影只地出现,比如HTML代码的第四行<meta charset="utf-8">(定义网页编码格式为 utf-8),就是此类。
但大部分情况下用的都是成双成对出现的标签:
标签2
开始标签+结束标签+中间的所有内容,它们在一起就组成了【元素】。
元素
常见的元素有:
常见元素
根据表格,回看一下上面那段HTML代码,里面就有<h1>,<h2>和<p>。再对照看代码的显示结果,<h1>是一级标题,<h2>是二级标题,<p>是段落文本,它们一一对应。
HTML标签是可以嵌套标签的,而且可以多层嵌套;这就像是在电脑中,一个硬盘可以包含数个文件夹,文件夹中还可以嵌套文件夹。












网友评论