什么是XML技术?
本单元是探讨了什么?
- 本单元,解释的是基础的XML元素。
你能做什么?
完成本单元之后,你应该能:
- 描述基本的XML规则
- 明确是什么使得XML结构良好
- 列出组成XML文档的组件
- 区分XML和HTML的区别
- 用XML描述国际化支持
- 为XML定义一些最佳实践
如何检查你的进度?
问责制:
- 检查点
- 上机练习
单元目标
完成本单元之后,你应该能够做到:
- 描述基础的XML规则
- 描述是什么使得XML文档结构规范
- 列出XML构成XML文档的组件
- 区分XML与HTML的区别
- 描述XML中的国际化支持
- 定义XML的最佳实践
什么是XML?
- XML的核心是按照一组定义良好的规则格式化的简单文本。
- XML文档主要由标记和文本组成。
-如果您看过HTML文档的源代码,那么XML结构应该很熟悉。
- 标记定义具有文本值的键,并且可以包含任何主题的数据,即名称-值对。
-示例:City=San Francisco,State=CA
- 此文本可以存储/表示为:
-存储在磁盘上的普通文件。
-通过HTTP发送的消息。
-编程语言中的字符串。
-数据库中的文本BLOB(二进制大对象)。
-可以使用文本数据的任何其他方式。
注意:
- 通常人们会谈论这个XML和那个XML或这个XML文件,他们真正指的是表示特定数据的XML文本。
- 只要XML文本或定义遵循规则的语法集,就可以表示任何数据。然而,XML文本通常用于表示有组织的、可重复的数据。
- 特定的XML文本可以用于表示信息(就像HTML一样),但通常用于具有用于表示的相关标准和工具的数据。
指导说明:
意图--说明了XML是一些遵循一系列规则的简单文本。
详细说明:XML的能力来自其简单性/理解性,在被引入以满足一个需要,工业验收,以及强大的工具时的时间性。
如果工业支持在这里,则任何考虑周到的、简单的、key-value键值对、基于文本的数据定义方法都可能被提升到XML中。XML标准是不寻常的广泛接受的和缺乏批评者。
XML的原始强度是简单的。他的核心,是简单的文本数据标记和定义标记。以另一种方式,XML包括自定义数据。
Key-value键值对在数据和编程世界中被广泛使用。当你看一个数据库中的某一列的值时,你使用键(“键”的名称)来确定柱值(“列内的值”)。当你在编程中有一个对象时,使用一个属性的名称来访问属性的值,而该属性就是键。
附加信息--
过渡语句--让我们看一个样本XML文件并在树状样式中看它。这是一个通俗并且实用的方法来看XML并且很快,当你接触一部分XML文档如何编排时,你就会发现这些会派上用场。
XML文档树状展示样例
XML文档应该被想象成具有树状继承结构的文档。
提示:
- 这个样例展示了一个典型的XML文档并且说明了如何通过树状节点来展示。
- 这个XML文档的概念描绘非常重要。
指导说明:
目的--演示如何将XML文档表示为节点树。详细信息-如图所示,XML文档可以直接而准确地表示为层次树结构。
请注意,根节点与根元素不同。根节点包含根元素之外的所有内容。这可能包括处理与文档整体相关的指令、注释或其他信息。不要让这一点迷惑你。本例的实际根元素节点是lt;bookgt;。
在这个图中,要做的最后一点是元素的顺序。即使元素lt;authorgt;、lt;titlegt;和lt;pricegt;在树中处于同一级别,它们仍然有一个从左到右的隐含顺序。这在实际的XML文档中表示。
附加信息--
转换语句--主要要求是XML文档必须结构良好。让我们看看什么是良好的形式。
XML结构良好的基础
- 当XML文档遵循一组定义基本XML语法和结构的规则时,它们被认为是格式良好的。
-单个根元素:所有其他元素都嵌套在根元素中。
-元素必须正确终止。
-标记名和属性名必须遵循XML命名规则。
-必须引用所有属性值。
指导说明:
目的--解释XML结构的简单规则。
细节说明--为了被认为是格式良好的,XML文档必须遵循这些简单的规则。
第一行必须包含将文件标识为XML文档的特殊标记。为了遵循层次结构,必须有一个根元素。所有其他元素和文本必须包含在根元素中。
元素标记必须遵循基本结构。对于每个开始标记“lt;hellip;gt;”,必须有一个匹配的结束标记“lt;/hellip;gt;”。结束标记由标记名开头的斜线标识。例外情况是一个空标记,它的开始标记由尾随的“lt;hellip;/gt;”关闭。属性,可以为元素提供的额外信息必须正确引用。元素名和属性名都必须遵循正确的命名约定。元素标记必须嵌套在父标记下面(除了单个根标记)。XML中的子元素嵌套级别没有限制。本节将更详细地介绍这些主题中的每一个。将详细讨论组件。
附加信息--
转换语句--ok,现在您知道了XML的规则,我们将查看其中一个并标识其内容。
一个简单的XML文档-基础结构
lt;?xml version=”1.0”?gt; |
选项第一行;仅仅在编码方式不是UTF-8或者UTF-16时需要 |
lt;bookgt; |
根元素开始标签 |
lt;titlegt; Alphabet from A to z lt;/titlegt; |
第一个孩子元素 |
lt;isbn number=”1112-23-4356”/gt; |
空元素 |
lt;authorgt; |
开始元素标签 |
lt;firstNamegt;Borenglt;/firstNamegt; |
裸露的孩子元素 |
lt;/authorgt; |
结束元素标签 |
lt;chapter title=”Letter A”gt; This letter A is the first in the alphabet. It is also the first five vowels. lt;/chaptergt; |
包含属性和通过的字符数据的元素 |
lt;!-- The rest if the letter chapter are missing --gt; |
注释 |
lt;chapter title =”Letter Z”gt; The letter Z is the last letter in the alphabet. lt;/chaptergt; |
文档中最后的元素 |
lt;/bookgt; |
根结束标签 |
注意:
- 在标签之间的文本数据也被当作内容,任何标签元素也被称作标记。
指导说明:
目的--呈现一个小的XML文件并标识它的每个部分。
细节说明--XML是一种为数据提供意义的简单方法。标记用于提供包含值的名称。标记和文本包含在提供数据顺序和关系的层次结构中。
尽管HTML和XML有一个共同的外观,但是在本节中有几个重要的区别将被解释。
在这个屏幕的左边是一个简单的XML文档。右边是标识XML的一些关键特性的注释。
对于每个XML组件,指出它在文档中的位置。一旦确定了所有组件,我们将介绍每个组件的详细信息。
快速识别此XML文档的以下组件。
bull;根元素(lt;bo...gt;...lt;/bookgt;),单个根元素定义分层数据树的顶部,从而定义文档其余部分的基础。
bull;子元素(标题、章节和文本数据)。
bull;属性(isbnamp;标题)
bull;注释(lt;!-- ...)
bull;解析过的字符数据。
其他注释
bull;缩进和其他空白仅用于提高可读性,但会增加文件大小和处理要求。这是大型XML文档的一个问题。
bull;识别属性中的引号。
附加信息--
转换语句--现在您已经审阅了XML文档,我们可以解构它并检查它的碎片。让我们仔细研究一下XML声明。
XML声明
- XML声明是所有XML文档中的可选第一行:
lt;?xml version=“1.0”?gt;
lt;?xml version=“1.0”encoding=“UTF-8”?gt;
lt;?xml version=“1.0”standalone=“yes”?gt;
- encoding属性表示文档中使用的字符编码;如果使用UTF-8或UTF-16,则可以省略。
-ASCII是UTF-8的子集,不需要声明。
- 独立属性用于指示文档是否依赖于外部声明给文档实体的内容信息;值可以是yes或no。
-在大多数情况下,文档实体是包含XML文档的文件。
-当属性不存在时,该值默认为“yes”。
注意:
所有XML文档都可以选择以该标记开头;如果使用,则必须位于文件的第一个位置(即标记前没有空行、注释或空格)。当前的XML版本是1.0,必须出现在lt;?xml标记。其他属性是可选的。
除非文档具有特定的编码,否则它不是严格要求的,但最好在所有XML文档中包含XML声明。它指明了为其编写文档的XML版本,尽管目前只有一个XML版本,但情况并非总是如此。
指导说明:
目的-讨论XML声明。
详细信息-特别提到XML声明及其属性:
lt;?xml version=“1.0”encoding=“UTF-8”standalone=“yes”?gt;
- 所有XML文档都应该以这个标记开头,并且它必须位于文件(即标记前没有空行或空格)。
- 当前的XML版本是1.0,必须出现在lt;?XML标记。
- encoding属性表示字符的编码方式,不同的XML程序在处理文档时使用此值。使用UTF-8或UTF-16字符的文档不需要指定编码。
- 如果声明影响内容,则独立属性通知处理器文档的外部存在于文档实体。被认为是有效的。
验证解析器时,独立属性必须具有值,另外,如果任何外部文档解析器包含了以下声明:
-拥有默认值的属性,如果应用这些属性的元素出现在没有这些属性值规范的文档,或
-实体(除了amp;amp;amp;、amp;amp;lt;、amp;amp;gt;、amp;amp;apos;、amp;amp;quot;),如果引用这些实体出现在文档中,或lt;
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[234926],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。