简单介绍可扩展标记语言XML

时间:2022-09-17 07:56:12

简单介绍可扩展标记语言XML

摘要:XML全称EXtensible Markup Language,翻译为扩展的标记语言,是Internet环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具。它与HTML一样,都是SGML(Standard Generalized Markup Language,标准通用标记语言)。比SGML简单得多,比HTML更令编程人员喜爱,它包含了很多SGML特性,继承了SGML的优点,文档结构严谨,层次分明,语义更加明确,具有良好的可读性、易编写和易维护等特性,而且使得多媒体信息在不同的系统之间相互交流成为现实。本文通过例子,简单介绍XML的使用,从中感受XML极其简单易于掌握和使用。

关键词:XML;历史发展;优点;文档结构;介绍

中图分类号:TP312文献标识码:A文章编号:1009-3044(2010)20-5523-04

A Brief Introduction to XML Extensible Markup Language

YUAN Yan-fen, LIANG Shen-qing

(Guangdong Province Meteorological Information Center, Guangzhou 510080, China)

Abstract: XML full name is EXtensible Markup Language, translated as Extensible Markup Language, is a cross-platform Internet environment, depends on the content of technology, is currently structured document information processing a powerful tool. As with HTML are SGML (Standard Generalized Markup Language, Standard Generalized Markup Language). Much simpler than SGML, HTML even more programmers than love, it contains a lot of SGML features, inherited the advantages of SGML, the document well-structured, structured, meaning more clearly, has good readability, easy to prepare and easy to maintain and other features, but also make multi-media information exchange between different systems become a reality. In this paper, examples of the use of brief XML, XML is extremely simple and easy experience from which to grasp and use.

Key words: XML; history; advantage; document; introduction

XML的应用越来越广泛。无论在数据交换、Web服务、内容管理、Web集成,还是配制数据等,都在使用XML。XML是Internet环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具。扩展标记语言XML是一种简单的数据存储语言,使用一系列简单的标记描述数据,而这些标记可以用方便的方式建立,虽然XML占用的空间比二进制数据要占用更多的空间,但XML极其简单易于掌握和使用。今后支持XML的软件也将会越来越多,XML离我们的工作生活也将越来越近。

1 XML的发展概况

XML是什么?XML是Extensible Markup Language的缩写,译为可扩展的标记语言。XML是一套完善的定义语义标记的规则。

为了说明XML的发展历史,让我们先看看图1。

在20世纪80年代末期,位于瑞士的欧洲原子物理实验室(CERN)的研究人员为了使他们的工作方便而开发了WEB技术,他们的目的是将实验室网络上的研究文档共享。到了1986年,ISO国际标准化组织颁布了ISO 8879 号国际标准,即SGML(Standard Generalized Markup Languge-标准通用标记语言),它是一种通用的文档结构描述置标语言。由于SGML非常复杂,不易使用,在1992年,CERN的研究人员把WEB技术(纯文本浏览器和最初版本HTML-简化的SGML)提交给INTERNET协会,从此,HTML(HyperText Markup Language)开始流行,并逐渐发展成一个庞大的家族,版本由原来的HTML 1.0 , HTML 2.0,HTML 3.2 , HTML 4.0到目前的HTML 4.1 ,以及兼容XML格式的XHTML 1.0(Extensible HyperText Markup Language),XHTML 1.1 和 XHTML 2.0 (XHTML 2.0的第五个工作草案在2003年5月6日公布)。

虽然HTML已经非常流行,并且现在的程序员大多数都在使用它来创建WEB网站,但是,由于HTML是一个实例置标语言,无法完整描述数据内容,也不能描述矢量图形、科学符号等对象,格式表现不能独立,结构不严格等诸多因数,在1998年2月10日,国际互联网论坛W3C(World Wide Web Consortium)XML 1.0 ,随后在2000年10月6日了XML 1.0 (Second Edition),错误修正见 /XML/xml-19980210-errata ,2003年10月30日了XML 1.0 (Third Edition),错误修正见/XML/xml-V10-2e-errata 。为简单化SGML,XML重新定义了一些SGML的内部值和参数,并删去大量繁杂的、不常用的、使编程复杂的特征,内容见/TR/NOTE-sgml-xml-971215 。其实XML是SGML的一个子集,它包含了很多SGML特性,继承了SGML的优点,但是要比SGML简单得多,比HTML更令编程人员喜爱。正是由于这些原因,XML的Internet应用大量涌现。如化学标记语言(Chemical Markup Language)、数学标记语言(Mathematical Markup Language)、同步的多媒体集成语言(Sychronized Multimedia Integration Language)、可伸缩的矢量图形(Scalable Vector Graphics)、矢量标记语言(Vector Markup Language)、音乐标记语言(MusicML)、语音朗读标记语言(VoxML)、濒道定义格式(Channel Definition Format)等等。

2 XML的优点

XML和HTML都从属于SGML,但是XML是一种元标记语言。XML描述的是文档的结构和意义,而不描述页面元素的格式化,用户可以根据自己的需要定义标记来描述和创建文档,这样的文档结构严谨,层次分明,语义更加明确,更适合人类的阅读习惯和更便于计算机的查找、存档。例如,描述广东省气象局各处室科室的电话号码。通常人们用Microsoft Word描述的格式如下:

广东省气象局

电信台:

运行科电话:87754050

运行科Email :

网络科电话:87625482

网络科Email :

……

气象台:

短时科电话:87777786

短时科Email :

短期科电话:87778667

短期科Email :

……

……

如果改为用XML来描述,则为如下:

运行科

87754050

网络科

87625482

……

……

比较上述两种文档,XML格式描述的结构和语义更加清晰明了,易于理解,并且XML文档是一种纯文本,非专有的格式,不受版权、专利等其他知识产权的限制,可以使用任意的编辑器进行编辑,可以显示在各种设备上。而用Word等其他专用编辑软件编辑的文档受到专有格式的限制,不利于数据交换,不利于计算机的查找。

XML和HTML相比,两者都支持统一字符编码协会(Unicode Consortium)制定的通用字符集(UCS-Universal Character Set),都支持层叠样式单(CSS-Cascading Style Sheets)外观输出;不同在于XML支持文档类型定义DTD(Document Type Definition),支持专有的可扩展的样式语言(XSL-Extenible Style Language),支持比HTML更为复杂的XLink和XPointer链接等。在信息交互方面,XML同样可以使用列表(有序olist和无序ulist)和表格(table)来组织和表示数据,创建表单(form)和XML数据库,通过“POST”方法将表单中的控件(文本框TEXT、口令框PASSWORD、复选框CHECK、单选框RADIO等)内容提交给服务器完成信息交互。

3 XML文档结构

以“广东省气象局各处室科室的电话号码”为例创建一个简单的结构完整的XML文档。如下:

Metelephone.xml

运行科

87754050

网络科

87625482

Metelephone.dtd

Metelephone.xsl

xmlns="/TR/REC-html40"

result-ns="">

广东省气象局联系信息

电话 :

EMAIL:

微软(Microsoft)IE5.0以上版本支持XML文档浏览。

4 结束语

随着因特网(Internet)的飞速发展,Web的应用也越来越广泛,超文本不仅用来传送文字信息,更多的是传送多媒体信息――图片、声音、视频、 动画。XML的出现,为网络应用注入了强大的动力,它不仅具有良好的可读性、易编写和易维护等特性,而且使得多媒体信息在不同的系统之间相互交流成为现实。XML 新的版本正在制定中,有关XML的详细资料请参阅国际互联网论坛W3C(World Wide Web Consortium)的主页。

参考文献:

[1] 吴敏,丁永生,陈家训.XML的研究现状及展望[J].微型电脑应用,2001,17(4):5-9.

[2] 李莉,吾守尔・斯拉木,缪成.XML在电子政务中的应用[J].计算机工程,2003,23(Z2):170-179.

[3] 吴文辉,殷建平,姚丹霖.关系模式到 XML模式的转换研究[J].计算机工程与科学,2004,30(18):165-167.

[4] 葛莹歆,夏克俭,曾德华.XML在电子公文中的应用[J].计算机工程与设计,2005,26(10):2863-2865.

上一篇:IPv6过渡机制和安全性综述 下一篇:网上报名系统