admin管理员组

文章数量:1530828

2024年2月1日发(作者:)

XML简介

XML代表Extensible Markup Language(eXtensible Markup Language的缩写,意为可扩展的标记语言)。与HTML相似,XML是一种显示数据的标记语言,它能使数据通过网络无障碍地进行传输,并显示在用户的浏览器上。XML是一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识。它也是元标记语言,即定义了用于定义其他与特定领域有关的、语义的、结构化的标记语言的句法语言。

XML是元标记语言

关于XML要理解的第一件事是,它不只是像超文本标记语言(Hypertext Markup

Language,HTML)或是格式化的程序。这些语言定义了一套固定的标记,用来描述一定数目的元素。如果标记语言中没有所需的标记,用户也就没有办法了。这时只好等待标记语言的下一个版本,希望在新版本中能够包括所需的标记,但是这样一来就得依赖于软件开发商的选择了。

但是XML是一种元标记语言。用户可以定义自己需要的标记。这些标记必须根据某些通用的原理来创建,但是在标记的意义上,也具有相当的灵活性。例如,假如用户正在处理与家谱有关的事情,需要描述人的出生、死亡、埋葬地、家庭、结婚、离婚等,这就必须创建用于每项的标记。新创建的标记可在文档类型定义(Document Type Definition,在以后的篇幅中常简称为DTD)中加以描述。在本书的第二部分中将会学到有关DTD的更多的知识。现在,只需把DTD看作是一本词汇表和某类文档的句法。例如,在Peter Murray-Rust的Chemical Markup Language (化学标记语言,简写为CML)中的文件中描述了词汇表和分子科学的句法:其中包括chemistry(化学)、crystallography(结晶学)、solid

state physics(固体物理)等词汇。它包括用于atoms(原子)、molecules(分子)、bonds(化学键)、spectra(光谱)等的标记。这个DTD可与分子科学领域中的许多不同的人共享。对于其他领域也有其他的DTD,用户还可以创建自己的DTD。

XML定义了一套元句法,与特定领域有关的标记语言(如MusicML、MathML和CML)都必须遵守。如果一个应用程序可以理解这一元句法,那么它也就自动地能够理解所有的由此元语言建立起来的语言。浏览器不必事先了解多种不同的标记语言使用的每个标记。事实是,浏览器在读入文档或是它的DTD时才了解了给定文档使用的标记。关于如何显示这些标记的内容的详细指令是附加在文档上的另外的样式单提供的。例如,考虑薛定格(Schrodinger)方程:

科学论文中充满了这一类方程,但是科学家还必须等待多年,才能让浏览器的开发商支持书写最基本的数学公式所需的标记。音乐家也有同样的局限性,因为Netscape Navigator和Internet Explorer还都不支持乐谱。

有了XML就意味着不必等待浏览器的开发商来满足用户的需要了。用户可以创建自己需要的标记,当需要时,告诉浏览器如何显示这些标记就可以了。

XML标记描述的是文档的结构和意义。它不描述页面元素的格式化。可用样式单为文档增加格式化信息。文档本身只说明文档包括什么标记,而不是说明文档看起来是什么样的。

XML 的起源和目的

1 9 9 6 年,万维网协会(或者叫W 3 C ,h t t p : / / w w w. w 3 c . o rg )开始设计一种可扩展的标记语言,使其能够将S G M L 的灵活性和强大功能与已经被广泛采用的H T M L 结合起来。这种后来变成X M L 的语言继承了S G M

L 的规范,而且实际上就是后者的一个子集。从S G M L 入手使得该设计小组能够将精力集中在简化已有的成果上。S G M L 已经提供了一种可以无限扩展的语言,它允许任何人能够根据自己的需要加以扩充。X M L 之所以要较S G M L

更为简化,很大程度上是出于易用性的考虑:人们对标记的读写过程应该使用现有的、简便通用的工具,同时,我们也应当简化计算机对文档和数据交换的处理。由于有太多的可选功能,S G M L 变得过于复杂,以至于很难编写出针对这种语言的普通解释器,而X M L 的解释器则简单得多。此外,X M L 使得现有的I n

t e r n e t协议和软件更为协调,从而简化了数据处理和传输。作为一个不错的S G M L 子集,X M L 还保持了对现有的面向S G M L 的系统的向下兼容性,这样,用X M L 标记过的数据就仍然可以在这些系统中使用,为基于S G M L 的行业节省了大笔的改造费用,同时,与We b 的结合也使得它们更便于被访问。1998 年2 月,XML 1.0 成为了W3C 的推荐标准。包括Extended Backus-Naur

Form (EBNF) 中语法标识在内的这个正式的规范可以很容易地从W 3 C 的We b

站点(h t t p : / / w w w. w 3 c . o rg / T R / R E C - x m l )上得到;此外,X M L 规范的制定者之一Tim Bray 还在h t t p : / / w w w. x m l .

c o m / a x m l / t e s t a x m l . h t m 上提供了一个有着非常不错的注解的版本。在/xml/上,由Peter Flynn 等人代表W3C 的XML

研究组维护的一个XML 1.0FAQ 还提供了到其他与XML 相关的主题的链接。X M L

是一种界定文本数据的简便而标准的方法。它曾经被人称作“We b 上的A S C I

I 码”。就好像你可以使用自己喜爱的编程语言来创建任何一种数据结构,然后同其他人在其他计算平台上使用的其他语言来共享一样。X M L 的标记用来说明你所描述的概念,而属性则用来控制它们的结构。所以,你可以定义自己所设计出的语法并同其他人共享。

XML的特点:

1.

使用有意义的标记(TAG)

HTML:给浏览器读取,不能传达数据的语义。

XML:具有语义。

2.

数据的语义与显示方式分开

HTML:决定数据显示方式的语言。

XML:描述数据内容的语言,本身并不决定数据该如何显示,数据的显示由XSL决定。

3.

可自定义的标记

HTML:标记由少数权威团体制定,种类有限且不能随意添加。

XML:可由用户按需要增加标记。如数学标记语言MATHML、财经标记语言FPML、电子商务标记语言EBXML等。

4.

严格的语法控制

HTML:语法规则比较多元化,具有较大灵活性。文件结构比较松散,不能很容易的转换为其他类型格式,比较难用程序来做大量而有效的处理,数据再利用的潜力大为降低。

XML:对语法有严格的要求,所有XML的文件都必须经过严格的“验证”过程才算完成,文件格式容易转换。

XML的优势:

XML最大的优势在于对各种数据的管理。

任何系统都可以通过XML的解析器来读取XML数据,因此它的数据可以通行各处,而不用担心系统不支持的问题。

1.

数据的检索:

Internet上主要的数据检索方式:分类检索和全文检索。

检索效率低,或找不到。

XML:在语义标记作为搜索索引;在文件中截取关键部分。

所有标记内的数据都可视为一个元素,而每一个元素都可以作为数据的索引。

2.

数据的显示:

XML将数据保存的格式与数据显示的方式分开,使得XML文件可以轻易地更换数据显示的方式,仅需改变XSL的设置,用户就可以将同一数据制作成HTML、PDF、WML(Wireless Markup Language)、HDML(Hand-Held Device Markup Language)等不同格式,供不同的硬件显示。

3. 数据的交换:

XML语法简单,可以被所有的机器解读,又可以在各种平台上使用,使得XML有潜力成为一个通行四海皆准的标记语言。

XML的应用:

XML的应用主要有:内容管理(Content Management)、电子邮件的收发与管理、智能型日历、个性化信息服务、电子商务。

Trackback: /?PostId=17606

[收藏到我的网摘] yuan_er发表于 2003年08月22日 11:13:00

本文标签: 标记语言数据文档显示