xml基础

作者: LU7IN | 来源:发表于2018-03-11 17:51 被阅读0次

XML是什么?

●XML 指可扩展标记语言(EXtensible Markup Language)
●XML 是一种标记语言,很类似 HTML
●XML 的设计宗旨是传输数据,而非显示数据
●XML 标签没有被预定义。您需要自行定义标签。
●XML 被设计为具有自我描述性。
●XML 是 W3C 的推荐标准

XML与HTML的主要差异

XML 不是 HTML 的替代。
XML 和 HTML 为不同的目的而设计:
XML 被设计为传输和存储数据,其焦点是数据的内容。
HTML 被设计用来显示数据,其焦点是数据的外观。
HTML 旨在显示信息,而 XML 旨在传输信息。

一个简单的XML文件

<?xml version="1.0" encoding="UTF-8"?>
<body>
   <school>
      <teacher>Jack</teacher>
      <student>Mark</student>
   </school>
</body>

这是一个简单的XML文件,文件的第一行是XML的声明,version="1.0"指的是XML的版本,encoding="UTF-8"则是所使用的编码方式。注意:<?之间不能有空格,否则则会出错。

XML可以发明属于自己的标签

什么意思呢?在HTML中我们知道标签这个概念,但是HTML当中的标签是都是规定好的,标签当中不能有中文字符出现,但是在XML当中,我们可以使用中文标签:<中文>

图片.png
XML 文档形成一种树结构

XML 文档必须包含根元素。该元素是所有其他元素的父元素。
XML 文档中的元素形成了一棵文档树。这棵树从根部开始,并扩展到树的最底端。

父、子以及同胞等术语用于描述元素之间的关系。父元素拥有子元素。相同层级上的子元素成为同胞(兄弟或姐妹)。

所有元素均可拥有文本内容和属性(类似 HTML 中)。

图片.png

图片当中的根元素是 <bookstore>。文档中的所有 <book> 元素都被包含在 <bookstore> 中。
<book> 元素有 4 个子元素:<title>、< author>、<year>、<price>。

XML的标签必须是闭合的

在HTML当中,有些标签是无需闭合的。就像<p><h>等等。但是在XML中,不闭合的标签是非法的。

图片.png 图片.png
XML 标签对大小写敏感

在XML文档中,我们的标签是区分大小写的,我们必须确保我们写的标签大小写正确,不然也是会报错的。

实体引用

在 XML 中,一些字符拥有特殊的意义。
如果你把字符 "<" 放在 XML 元素中,会发生错误,这是因为解析器会把它当作新元素的开始。
这样会产生 XML 错误:

图片.png

为了避免这个错误,用实体引用来代替 "<" 字符。

下面是5个预定义的实体引用:

图片.png
XML 元素 vs. 属性

请看下面的例子:

<person sex="female">
  <firstname>Anna</firstname>
  <lastname>Smith</lastname>
</person> 

<person>
  <sex>female</sex>
  <firstname>Anna</firstname>
  <lastname>Smith</lastname>
</person> 

在第一个例子中,sex 是一个属性。在第二个例子中,sex 则是一个子元素。两个例子均可提供相同的信息。没有什么规矩可以告诉我们什么时候该使用属性,而什么时候该使用子元素。但是在 HTML 中,属性用起来很便利,但是在 XML 中,应该尽量避免使用属性。如果信息感觉起来很像数据,那么请使用子元素吧。

文档类型定义(DTD)可定义合法的XML文档构建模块。它使用一系列合法的元素来定义文档的结构。DTD 可被成行地声明于 XML 文档中,也可作为一个外部引用。
内部的 DOCTYPE 声明

<!DOCTYPE 根元素 [元素声明]>

请看下面的例子:

图片.png 图片.png

上面的例子报错了,因为在DTD当中规定了标签的顺序,先是teacher接着是student最后才是classroom,但是在XML中先写了classroom标签,因此报错了。

<?xml version="1.0"?>
<!DOCTYPE note [
  <!ELEMENT note (to,from,heading,body)>
  <!ELEMENT to      (#PCDATA)>
  <!ELEMENT from    (#PCDATA)>
  <!ELEMENT heading (#PCDATA)>
  <!ELEMENT body    (#PCDATA)>
]>
<note>
  <to>George</to>
  <from>John</from>
  <heading>Reminder</heading>
  <body>Don't forget the meeting!</body>
</note>
以上 DTD 解释如下:
●!DOCTYPE note (第二行)定义此文档是 note 类型的文档。
●!ELEMENT note (第三行)定义 note 元素有四个元素:"to、from、heading,、body"
●!ELEMENT to (第四行)定义 to 元素为 "#PCDATA" 类型
●!ELEMENT from (第五行)定义 from 元素为 "#PCDATA" 类型
●!ELEMENT heading (第六行)定义 heading 元素为 "#PCDATA" 类型
●!ELEMENT body (第七行)定义 body 元素为 "#PCDATA" 类型
外部文档声明

假如 DTD 位于 XML 源文件的外部,那么它应通过下面的语法被封装在一个 DOCTYPE 定义中:

<!DOCTYPE 根元素 SYSTEM "文件名">

这个 XML 文档和上面的 XML 文档相同,但是拥有一个外部的 DTD:

<?xml version="1.0"?>
<!DOCTYPE note SYSTEM "note.dtd">
<note>
<to>George</to>
<from>John</from>
<heading>Reminder</heading>
<body>Don't forget the meeting!</body>
</note> 

这是包含 DTD 的 "note.dtd" 文件:

<!ELEMENT note (to,from,heading,body)>
<!ELEMENT to (#PCDATA)>
<!ELEMENT from (#PCDATA)>
<!ELEMENT heading (#PCDATA)>
<!ELEMENT body (#PCDATA)>
为什么使用 DTD?

通过 DTD,您的每一个 XML 文件均可携带一个有关其自身格式的描述。
通过 DTD,独立的团体可一致地使用某个标准的 DTD 来交换数据。
而您的应用程序也可使用某个标准的 DTD 来验证从外部接收到的数据。
您还可以使用 DTD 来验证您自身的数据。

未完待续。。。

相关文章

  • XML编程目录

    XML编程目录 XML基础Web Service

  • xml基础

    XML是什么? ●XML 指可扩展标记语言(EXtensible Markup Language) ●XML 是一...

  • XML基础

    XML的作用 XML语法(由w3c组织规定的) 注意:保存xml文档时的编码和解析xml文档时的编码要保持一致,才...

  • XML基础

    HTML 中文名称:超文本标记语言 优点:简单 缺点:不可扩展 作用:显示 XML eXtensible Mark...

  • XML基础

    XML(eXtensible Markup Language,可扩展标记语言)是由SGML(标准通用标记语言)发展...

  • XML基础

    目录 1. 写在前面 2. 关于XML需要知道的 写在前面 提到XML,不少人就开始提HTML总有人觉得谁是谁的衍...

  • XML基础

    XML概述 英文全称为Extensible Markup Language,翻译过来为可扩展标记语言。XML技术是...

  • XML基础

    请介绍一下,XML文档定义的几种形式,它们之间有何本质区别?再说说,解析XML文档又有哪几种方式? 考察点:XML...

  • AJAX基础及原理

    AJAX基础知识 什么是AJAX?async javascript and xml, 异步的JS和XML XML:...

  • 【网络安全】JAVA代码审计—— XXE外部实体注入

    一、WEB安全部分 想要了解XXE,在那之前需要了解XML的相关基础 二、XML基础 2.1 XML语法 所有的X...

网友评论

      本文标题:xml基础

      本文链接:https://www.haomeiwen.com/subject/bgjwfftx.html