admin管理员组

文章数量:1532518

2024年7月17日发(作者:)

初探Web技术

WWW(World Wide Web)是一种建立在Internet

上的全球性的、交互的、动态、多平台、分布式的图

形信息系统。同Telnet、E-mail、FTP、BBS等相似。

它也是建立在Internet上的一种网络服务。它遵循

HTTP协议。缺省端口是80。它的开发最初是为了在

科学家之间共享成果,科学家们可以将科研成果以图

文形式在网上进行共享。它的最基本的概念就是超文

本Hypertext,如果您用过任何一种在线帮助系统你就

会比较了解它的结构了。现在WWW的应用已远远超

出了原设想。成为Internet上最受欢迎的应用之一。

它的出现极大的推动了Internet的推广。

WWW的核心技术就是Web技术。

Web是由日内瓦粒子物理实验室发明的。Web技

术利用了一种称为超文本(Hypertext)的技术,即它

使用了在文件中有着加重色的词句或图形去链接或指

向其它文件、图形、声音等。它可以从一个文件中的

任何一点指向另一个文件的任何一点,从而可以实现

快速的信息浏览。同时超文本技术具有良好的图形用

户界面,使得用户能很容易地浏览因特网中的信息。

Web技术主要涉及到两个标准,一个是应用层协

议,称为超文本传送协议(HTTP);另一个是表示

层句法,称为超文本标记性语言(HTML)。Web技

术是在这两个标准的基础上发展起来的。

Web是什么?

先来看看两个名词:

一、超文本(hypertext)

一种全局性的信息结构,它将文档中的不同部分

通过关键字建立链接,使信息得以用交互方式搜索。

它是超级文本的简称。

二、超媒体(hypermedia)

超媒体是超文本(hypertext)和多媒体在信息浏

览环境下的结合。它是超级媒体的简称。用户不仅能

从一个文本跳到另一个文本,而且可以激活一段声音,

显示一个图形,甚至可以播放一段动画。

Internet采用超文本和超媒体的信息组织方式,将

信息的链接扩展到整个Internet上。Web就是一种超

文本信息系统,Web的一个主要的概念就是超文本连

接,它使得文本不再象一本书一样是固定的线性的。

而是可以从一个位置跳到另外的位置。你可以从中获

取更多的信息。可以转到别的主题上。想要了解某一

个主题的内容只要在这个主题上点一下,就可以跳转

到包含这一主题的文档上。正是这种多连接性我们才

把它称为Web。

Web的特点:

一、Web是图形化的和易于导航的(navigate)

Web 非常流行的一个很重要的原因就在于它可

以在一页上同时显示色彩丰富的图形和文本的性能。

在Web之前Internet上的信息只有文本形式。Web可

以提供将图形、音频、视频信息集合于一体的特性。

同时,Web是非常易于导航的,只需要从一个连接跳

到另一个连接,就可以在各页各站点之间进行浏览了。

二、Web与平台无关

无论你的系统平台是什么,你都可以通过Internet

访问WWW。浏览WWW对你的系统平台没有什么限

制。无论从Windows平台、UNIX平台、Macintosh

还是别的什么平台我们都可以访问WWW。对WWW

的访问是通过一种叫做浏览器(browser)的软件实现

的。如Netscape 的Navigator、Microsoft的Explorer

等。

三、Web是分布式的

大量的图形、音频和视频信息会占用相当大的磁

盘空间,我们甚至无法预知信息的多少。对于Web没

有必要把所有信息都放在一起,信息可以放在不同的

站点上。只需要在浏览器中指明这个站点就可以了。

使在物理上并不一定在一个站点的信息在逻辑上一体

化,从用户来看这些信息是一体的。

四、Web 是动态的

最后,由于各Web站点的信息包含站点本身的信

息,信息的提供者可以经常对站上的信息进行更新。

如某个协议的发展状况,公司的广告等等。一般各信

息站点都尽量保证信息的时间性。所以Web站点上的

信息是动态的。经常更新的。这一点是由信息的提供

者保证的。

Web动态的特性还表现在Web是交互的。

Web的交互性首先表现在它的超连接上,用户的

浏览顺序和所到站点完全由他自己决定。另外通过

FORM的形式可以从服务器方获得动态的信息。用户

通过填写FORM可以向服务器提交请求,服务器可以

根据用户的请求返回相应信息。

Web的工作方式

有了HTTP协议和HTML表示层句法,就可以构

成客户机/服务器系统的Web系统,在传统上称Web

的客户机为浏览器,它具有良好的图形界面,用鼠标

和键盘作为输入设备进行输入。Web的服务器一般仍

称作服务器。用HTML语言写成的文本称为主页

(homepage),在主页上有加重色的是超级链,当鼠

标指向超级链并且按下鼠标左按钮时,即可通过

HTTP协议将下一个主页传过来。

当然,仅是HTTP与HTML构建的Web系统功

能过于简单,它大大限制了Web的应用场合。为了增

强Web系统的能力,众多计算机厂商和标准化组织开

发了许多新的技术,它们包括服务器端的CGI、ASP

技术、客户机端的Java、Java Script、VB Script、ActiveX

等技术。这些技术使Web的应用扩展到更广阔的范

围。后面将分别对这些技术加以介绍。

“烘焙鸡”--新的宠儿

主页(home page)是通过万维网(Web)进行信

息查询时的起始信息页。

Homepage直译为主页,网民们爱称之为“烘焙

鸡”。Home Page主页是Web站点的首页,即被访问

站点的第一个网页。而Web pages网页就是可以被浏

览器访问的单个HTML文件。确切地说Homepage是

一种用超文本标记语言(描述性语言)将信息组织好,

再经过相应的解释器或浏览器翻译出的文字、图像、

声音、动画等多种信息组织方式。用户可以把它同报

纸、杂志、电视、广播等同等对待。Homepage的传

播方式是将源代码和与Homepage有关的图形文件、

声音文件放在一台服务器(称WWW)接受查询。许

多人都经营有自己的主页,而且尽量把它做得美观大

方,堆放上各种信息资料以吸引别人访问。每个主页

都有一个网址,相当于词典的页码。只要知道网址,

就可以到该主页进行浏览。比如你想了解IBM公司的

情况,你就可以浏览IBM公司的Homepage,它放在

IBM的WWW服务器上,那么应该在浏览器URL输

入的地方输入:/。

网页方圆的规矩-HTML

HTML(Hyper Text Mark-up Language)即超文本

标记语言,是WWW的描述语言,由WWW的发明

者Tim Berners-Lee提出。设计HTML语言的目的是

为了能把存放在一台电脑中的文本或图形与另一台电

脑中的文本或图形方便地联系在一起,形成有机的整

体,人们不用考虑具体信息是在当前电脑上还是在网

络的其它电脑上。这样你只要使用鼠标在某一文档中

点取一个图标,Internet就会马上转到与此图标相关的

内容上去,而这些信息可能存放在网络的另一台电脑

中。

HTML文本是由HTML命令组成的描述性文本,

HTML命令可以说明文字、图形、动画、声音、表格、

链接等。HTML的结构包括头部(Head)、主体(Body)

两大部分。头部描述浏览器所需的信息,主体包含所

要说明的具体内容。

HOMEPAGE(主页)是以HTML格式写成的,

HTML不是所见即所得的,不过HTML非常易学易用,

它以标签(TAG)标示及排列各对象。而标签本身则

以“<”和“>”号标识,标签内的内容称为元素

(ELEMENT),元素代表了标签的意义。

元素是与大小写无关的。它很类似与工业标准的

SGML(标准广义标置语言),它的结构可以归为

SGML文档类型定义(DTD)。

从HTML语言写成的文本样本中很容易看出这

种语言的特点:

--它的定界符(标识)都是可读的。

--它拥有超级链接(hyperlink),由这些超级链将

若干文本组合起来构成超文本(Hypertext)。

HTML写的文本是一种很直观可读的文本形式,

对于熟悉HTML的人员,看文本即可出现(想象出)

该文本显示在屏幕上的形式,但细心的读者可能也会

发现,标识占用的字节数很多,因而这种语言的效率

是不高的。

HTML的兄弟姊妹们

随着INTERNET的迅速发展,计算机标记语言以

其自身独有的特点为信息共享提供了许多便利,从而

得到了用户的广泛重视,标记语言对促进INTERNET

的发展也有着不可磨灭的功劳,现就标记语言的特点、

发展历史作一些简单的介绍。

一、标准通用标记语言--SGML

SGML是一种描述语言的语言,它定义了以电子

形式表示文本的方法。它的特点有:①正式的,能允

许验证文档的正确性;②结构化的,能够处理复杂的

文档;③可扩充的,能够支持大型信息存储的管理。

一个SGML由以下几个部分组成:①SGML声明,设

定基本情况;②定义DTD文档类型,设定标记语言结

构的语法;③描述用于标记的语义规格说明,做出了

DTD表达的语法限制;④包含数据和标记的文档实

例。

1969年,IBM的技术人员Charles Goldfarh 和

Edward Mosher等人一起发明了通用标记语言

(Generalized Marked Language)。它在各文档间共享

一些类似的属性,允许文本编辑、检索与格式化等子

系统共享文档。GML的大部分内容被IBM和其他公

司实现在主机时代的出版系统中,即使是现在,IBM

也仍在80%以上的文档中采用GML,另外,图形通讯

协会(GCA)也用此开发了用于排版的通用代码

GENCODE。1978年,新成立的ANSI机构之文本处

理计算机语言委员会(CLPTC)和GCA的GENCODE

委员会合作,在GML的基础上制定了SGML的第一

份草案。1985年在英国成立了国际SGML用户组织,

在1986年,SGML成为国际标准ISO8879:信息处理

标准通用标记语言(Information processing Text and

office system Standard generalized markup language)。

在80年代末,SGML引起了包括CERN在内的

一些组织的注意,1990年,World Wide Web的发明

者Tim Berners Lee选择了CERN使用的一组SGML

的DTD标记标签,在最早的WEB浏览器和编辑器

NEXUS中,他使用了这些标签和样式表进行排版,

并增加了最重要的功能--链接,这就是HTML的前身,

基于SGML的HTML是让SGML走向World Wide

Web的第一步。

二、超文本标记语言--HTML

超文本标记语言HTML(Hyper Text Markup

Language)是一种基于建立超文本/超媒体文档的标记

语言,是SGML的一种应用,它具有通用的语义,适

合于表示各系统域的信息。HTML的应用十分广泛,

它可用于描述超文本化的新闻、邮件与文档,超媒体

文档,操作菜单,数据库查询结果,嵌入图形的结构

化文档等。

HTML提供如下的基本功能:

①发布带有标题、文本、表格、列表、图像等的

在线文档;

②通过超级链接来获取在线信息;

③设计各种表单来提交或查询信息;

④在文档中直接包含电子表格、视频流、音频流

等高级应用程序。

HTML还可以通过URL语法,描述跨越

INTERNET各节点的超级链接,简单而实用地实现跨

整个INTERNET空间的数据存取,并且不因系统的不

同而破坏文档的完整性。HTML最初是由Tim Berner

Lee在CERN时开发,90年代随着World Wide Web

的爆炸性增长和NCSA开发的Mosaic浏览器而流行

于世界。HTML也在各方面都扩展着,1997年1月,

万维网协会(W3C)的HTML工作组发布了HTML3.2,

目前统一的版本是HTML4.0。此版本除了文本、多媒

体和超级链接功能外,还支持更多的多媒体选项、脚

本语言、样式表、更好的打印功能和其它功能。但是,

目前多数人认为,HTML还不稳定,此外,由于HTML

对超级链接已支持不足,以及缺乏空间立体描述,处

理图形、图像、音频、视频等多媒体能力较弱,图文

混排功能简单,没有时间信息,不能表示多种媒体的

同步关系,这势必影响HTML的大规模应用以及用于

复杂的多媒体数据处理。

三、扩展标记语言--XML

XML是特别为WEB应用设计的SGML的一个重

要分支。XML有许多特点:

①简单,XML经过精心设计,整个规范简单明了;

②开放,XML是SGML的分支,在市场上有许

多成熟的软件可用来帮助编写、管理等;

③高效且可扩充,支持复用文档片断,使用者可

以发明和使用自己的标签,也可与他人共享;

④国际化,标准国际化,且支持世界上大多数文

字。

XML被设计成为易于编写,易于解释和易于实现

的SGML的一个分支,比起HTML来,XML继承了

SGML的三大优点:①可扩展性,信息提供者可以针

对自己的应用程序定义新的标签和属性;②结构化,

文档结构可以嵌套到任意复杂的层次;③确认化,应

用程序不用应用外部定义的词汇就可以快速地检查

XML文档的结构正确性。可以这样说,一方面,虽然

XML源于SGML,但它并不是SGML的替代物,XML

省去了SGML的许多功能,但XML可以和SGML兼

容,使用SGML的人可以直接使用XML在网络上交

换数据,而不必转换已有的SGML文档;另一方面,

XML和HTML是互相补充的,HTML关于用户的界

面,XML关于数据链路,动态的HTML描述显示界

面和用户交互活动,XML描述信息,所以两者结合,

XML可以向HTML文档增加信息,而HTML可以显

示以XML格式表达的信息。一般认为,XML的目标

就是:能在INTERNET上直接使用;与SGML兼容;

支持大范围的应用;XML文档易于创建、清晰易读、

设计简单明了;易于编写处理XML文档的软件。XML

立志于在WEB内建立真实世界的知识影像,针对

HTML和INTERNET的标准、可扩展、通用的数据格

式,灵活地表示各种各样、自我描述的信息。XML可

以向INTERNET的数据增加结构,这有助于在WEB

上实现任何人、任何地方的任何事物的通信。

四、虚拟现实模型语言--VRML

VRML(Virtual Reality Modeling Language)语言

是一种用于对三维虚拟场景进行建模的描述性语言,

与World Wide Web的关系非常紧密。以文字为基础

的INTERNET已经发展了20多年,但只有在出现了

World Wide Web之后,INTERNET的发展才变得异常

迅速,才给人们带来巨大的商业价值,而这一切的根

本就是在于World Wide Web使用了全新的图形与超

文本界面。VRML是一种能在网络上使用的描述三维

环境的场景描述语言,也就是说,HTML定义二维,

而VRML定义三维,从而使其在空间上变得非常广

阔,又因其本身具有交互性,因而其对象都是处于空

间中并且能彼此交换的。VRML的应用范围很广,有

医疗构图、生化造型、建筑设计、广告设计、游戏设

计、虚拟场景设计等,VRML可以用来描述3D物体,

并能为简单的和复杂的3D物体提供高效率的的格式,

将现在的WEB技术结合VRML就可将WEB从二维

提升到三维,从而可以达到一些令人难以想象的效果。

1994年的World Wide Web会议,决定将VRML

建立在Open Inventor(SGI公司的三维图形开发工具)

的文件基础上,并公布了VRML1.0的规格草案,在

1996年3月,VRML咨询委员会(VGA)采用SGI

的Moving Worlds作为VRML2.0,并于同年8月正式

认定。VRML2.0作为业界一种开放独立的标准,在

INTERNET的动态交互式3D环境得到了应用。使用

EAI,程序员就可将VRML2.0与数据库、电子商务系

统、多用户服务器相连接,从而将电子商务中传统的

商品图片转换为三维立体模型,这有着非常重大的商

业意义。

总的来说,VRML是HTML的扩展,基本的概念

相类似,区别在于HTML文档是二维的,VRML则带

来三维空间的立体世界,这必将能给INTERNET的发

展带来更大的空间。

五、无线标记语言--WML

WML(Wireless Markup Language)是一种类似于

HTML的浏览语言,可以提供浏览支持、数据输入、

超级链接、文本和图像表现以及表格交互等。是应用

于"无线应用软件"环境下的网页语言。专为解决

HTML WEB页不能在移动设备上显示的问题,即为

WAP(Wireless Application Protocol)协议所包括的一

种标记协议语言。运用WML设计的页面可在移动电

话的微型浏览器上产生图示、按钮及超级链接的功能,

简化了网页的复杂程度。WML大约起源于1998年,

现在正在随着WAP的发展而在慢慢普及。

URL――金矿的矿井

URL(统一资源定位器,Uniform Resource

Locator)是WWW页的地址,俗称“网址”。它指定

了互联网上资源地址的标准方式,是WWW(World

Wide Web)协议的一部分。一个URL具有类似下面

的格式:/。URL

最简单的使用方式,是把它输入到WWW浏览器程序

中,例如Netscape和IE。

URL从左到右由下述部分组成:

Internet资源类型(scheme):指出WWW客户

程序用来操作的工具。如“”表示WWW服务

器,“ftp://”表示FTP服务器。

服务器地址(host):指出WWW页所在的服务

器域名。

端口(port):有时(并非总是这样)对某些资

源的访问,需给出相应的服务器提供端口号。

路径(path):指明服务器上某资源的位置(其

格式与DOS系统中的格式一样,通常由目录/子目录/

文件名这样结构组成)。与端口一样,路径并非总是

需要的。

URL地址格式排列为:scheme://host:port/path。

例如/pub/HXWZ就是一个典型的

URL地址。

客户程序首先看到http(超文本传送协议),便

知道处理的是HTML链接。接下来的是

站点地址,最后是目录pub/HXWZ。

而对于ftp:///pub/HXWZ/,

WWW客户程序需要用FTP进行文件传送,站点是

,然后去目录pub/HXWZ下,下载文件

如果上面的URL是

ftp://:8001/pub/HXWZ/,则FTP

客户程序将从站点的8001端口连入。

各类URLs简介

URL,即统一资源定位器。可以把它想象成文件

名的网络扩展。我们不但可以指出在目录下的文件名,

并且可以指出在网络上的哪一台机器的目录下的文

件。这个文件可以通过各种不同的方式得到。在URL

中还指定了访问这一文件的协议。根据协议的不同可

以把URL分成以下几种:

1. File URLs

指明一个FTP服务器可以简单得以如下方式指

定:

file:///

指定FTP服务器上的目录用如下URL:

file:///pub

2. Gopher URLs

Gopher(信息鼠)URLs比文件URLs稍微复杂一

点,因为Gopher服务器的处理机制略复杂于FTP服务

器。访问一个特定的Gopher服务器可以使用如下

URL:

gopher:///

有些Gopher服务器可能不设在通常的端口上(缺

省端口是70)。所以在指定某些Gopher服务器时还

需要指定端口,假设我们知道在机器

“”上的Gopher服务器的端口不是

70,而是1234,则正确的URL应该是:

gopher://:1234/

3. News URLs

新闻组的URL非常简单:news://ing

4. HTTP URLs

HTTP是超文本传输协议标准。HTTP服务器通常

用于超文本文档访问服务。它的URL写法和Gopher

很相似,对于一个在服务器上的

文件其URL是:

/

和Gopher相似,HTTP的缺省端口是80,如HTTP

指定其他端口则在URL中要写明这个端口号。例如端

口为1234则URL如下:

:1234/

5. E-mail URLs

电子邮件的URL也非常简单:

mailto://somebody@

6. Other URLs

除上述几种URL外还有许多种URL。但上述是

最重要的几种URL,关于其他URL的情况可以在网

上找到。

HTTP――网海之舟

HTTP(超文本传输协议,Hyper-Text Transport

Protocol)是用于在互联网上传输超文本文件的协议。

它对一个HTTP客户程序和一个HTTP服务程序进行

端对端的连接。HTTP是在WWW(WWW)上所应

用的最重要的协议。

它是Web 自己的协议,用来从一个HTTP服务

器上检索信息。这可以是用HTML写的文本文件,静

态图象,声音文件,动画视频或仅是简单的文本文件:

HTTP服务器知道怎样识别文件类型,并通过线路在

传输之前告诉你的浏览器将要传来什么样的文件,以

便浏览器知道如何对待。

HTTP是Web技术中的一个最基本的协议,它是

一个应用层协议,直接用TCP层传递。整个协议的通

信过程十分简单。

为了要讲清HTTP传送一个文件的通信过程,首

先有必要来重申一下URL的概念。URL(Uniform

Resource Locator)的中文意思为统一资源定位器,它

是用来确定在IP网上Web系统信息资源的位置的,

URL从结构上讲很有点像计算机中的文件名,例如下

面就是一个URL。

/hypertext/

这个URL实际上要找的是文件,前面

都是路径名。在Web系统中,就是用URL来寻找相

应文件的。当然实际上URL还可以有复杂的形式并可

带各种相关参数。在基本了解了URL后,就可以来看

HTTP是怎样工作的了。当客户机向服务器请求一个

文件时,首先要建立一条TCP连接,在TCP连接好

后,客户机就向服务器发送URL,让服务器根据URL

去寻找相应的文件,找到文件后就从已建立好的TCP

通道上发给客户机,文件发送完毕即拆除TCP连接。

当要寻找另一个文件时,需要重复上述过程。

从上述过程可以看出,HTTP协议十分简单。使

用HTTP后,服务器需要做的事只是接受一个请求

(URL),根据用户的请求发送相应文件,服务器不要

做任何检索轨迹的记录,从而使一个服务器支持的用

户数大为增加。但HTTP也有不少缺点,因为其简单,

每传一个文件就要建一次TCP连接、拆除一次TCP

连接,当要传送的文件很小时就非常不合算了。另外

由于服务器不能保留检索轨迹,因而为口令记忆等带

来了很大的麻烦,导致系统效率下降。

网络千里眼--浏览器

Web客户机一般称为Web浏览器(browser),

浏览器向万维网(Web)服务器发送各种请求,并对

从服务器发来的由HTML语言定义的超文本信息和

各种多媒体数据格式进行解释、显示和播放。

目前比较有名的浏览器有网景公司的Netscape

Navigator“航海家”(新版本为“通讯家”Communicator)

和微软公司的Internet Explorer“探索者”(简称 IE)。

浏览器是一个用户终端软件,它的核心作用是HTML

句法的译码器,它能够将由HTML句法所定义的文

本、图像、格式等很好地翻译出来,并将它们按照既

定的格式显示在用户终端的显示屏中。

浏览器被认为是网络计算机的第一个“迷人的应

用程序”。它让更多的新用户能更快地掌握网络航海

的技术,极大地推动了Internet的发展。

随着Web技术应用的日益广泛,人们对浏览器的

期望也越来越高,希望它能提供越来越高的表达能力。

为此HTML语言一再升版本,浏览器软件版本也一再

升级,以求满足用户不断增长的要求。

“万金油”--Java技术

Java是一种通用的编程语言,它可以用来创建一

种通过网络发布、动态执行的二进制程序,尤其适合

于在IP网上编写应用程序。它的出现给Web系统带

来了新的活力。Java作为一种“中间体(middle ware)”

的编程语言,是一种解释执行性的语言。Java语言具

有完全的平台无关性,它独立于具体平台,可以在各

种不同的机器平台上动态地载入和运行。为了避免对

平台的依赖性,Java代码是运行在Java解释器上的。

这样任何Java软件能够在任意平台上运行,只需要开

发一个“通用”的最终软件,就可在Web所有系统上

运行,从而大大加快了软件产品的开发。为了保证可

移植性,Java规定了各种数据长度的统一标准。

Java是一种面向目标的编程语言,它是用来支持

能在Web页中执行的小程序,这个小程序通常被称为

Applet。这种小程序(Applet)能够作为Web页部分

下载下来,并且在浏览器中执行。

Java是近几年随着网络的发展而流行的,它能够

在短短的几年内成为计算机界的热点,这跟它的种种

良好的特性是分不开的。随着Java标准的确立、技术

更是不断的成熟。在数据库处理方面,Java提供了

JDBC API,为数据库开发者提供了标准的应用程序接

口。还有RMI技术,它提供了远程对象引用的概念,

这和在过程式编程年代提出面向对象语言一样具有革

命性的意义。RMI技术更适合Java这种纯面向对象的

语言,它使得分布式环境下不同的Java程序之间的通

信更加简单自然,符合面向对象的语义。Java已经成

为开发网络数据库应用的理想工具之一。Java Applet

是Java与Web结合的产物,它给Web带来了动态效

果和极大的扩展,因为它本身就是一种编程语言,功

能上比静态HTML、CGI、JavaScript等都强大的多。

于是Java applet理所当然的成为实现WEB数据库应

用的理想途径.

本文标签: 信息语言服务器文档文本