javaWeb 之 XML基础(二)

六眼飞鱼酱① 提交于 2020-03-02 10:10:05

一、XML约束模式->纲要

● 格式良好的(Well-formed)XML

● XML的约束模式

● XML约束模式语言

● 有效的(Valid)XML

1、格式良好的(Well-formed)XML

● 计算机程序在处理XML文档之前,首先必须能够解析出XML文档内容中的各个元素的相关信息。

● 用于解析XML文档的解析器程序对应的英文术语叫Parser。

● 要让计算机程序解析出XML文档内容所表达的信息,

XML文档更应该严格遵循一定的语法。

● 遵守XML基本语法规则和规范的XML文档就可以称之为“Well-formed XML”,中文意思就是“格式良好的XML”。

2、XML的约束模式

● 为什么要有约束模式?

      举例:

      <书架>

            <书>

                 <书名>Java程序设计</书名>

                 <作者 姓名=“ ”></作者>

                 <售价 单位=“元”>38</售价>

                 <售价单位=“元”>28</售价>

          </书>

       </书架>

● 约束模式定义了XML文档中允许出现的元素名(也就是标记名)、元素中的属性、元素中的内容类型以及元素之间的嵌套关系和出现顺序。

● XML约束模式不仅定义了XML文档的词汇表,它还定义了一个XML文档必须遵循什么样的结构。

● 如果把一个XML文件看作是数据库中的一个表,那么XML约束模式就相当于数据库表结构的定义。

● 如果没有为一个XML文档指定约束模式,那么该文档中可以包含任何类型的标记:如果为一个XML文档指定了约束模式,那么它必须需满足约束模式所规定的结构、数据类型和数据关联等内容。

3、XML的约束模式语言

● 用作XML约束模式的内容也需要遵循一定的语法规则,这些语法规则就形成了XMl约束模式语言。

● XML约束模式语言是用来创造XML标记语言的语言,这种用于定义另一种语言的语言被称为元语言。

● 约束模式通常都是在一个单独的文件中进行定义,这个文件被称作模式文档。

● 与模式文档的概念相对应,一招模式文档编写的XML文档被称为实力文档。

● 先后出现的XML约束模式语言有XML DTD、XDR、SOX、XML Schema等等,其中应用最广泛和具有代表意义的是XML DTD和XML Schema。

4、有效的(Valid)XML

● 一个遵守XML的基本语法规则、且符合为它所指定的某个

XML约束模式的XML文档就可以称之为“Valid XML”

文档,中文意思就是“有效的XML”文档。

● 一个XML文档并不一定需要是有效的,但必须是格式良好的。

● 将一个XML文档和它所引用的XML约束模式进行比较分析,看其中的内容是否符合XML约束模式的过程叫校验(validation),校验过程也是通过解析器程序软件(Parser)来处理的。

● 根据能否对XML文档进行约束模式校验,可以将XML解析器分为两类:非校验类解析器(IE浏览器)和校验类解析器。

二、DTD(Document Type Definition)

● 对DTD的初步认识

● 在XML文档中引入外部DTD文件

● 在XML文档中直接嵌入DTD定义语句

● 元素定义

● 属性定义

● 实体定义

1、对DTD的初步认识

QQ截图20140310202334

2、在XML文档中引入外部DTD文件

● XML文档通过使用DOCTYPE声明语句(文档类型定义语句)来指明它所遵循的DTD文件,DOCTYPE声明语句紧跟在XML文档声明语句后面,有来年各种格式:

    1)<!DOCTYPE 文档类型名称 SYSTEM “DTD文件的URL”>

      2)<!DOCTYPE 文档类型名称 PUBLIC “DTD名称”“ DTD文件的URL”>

例如:

      1)<!DOCTYPE 书架 SYSTEM “book.dtd”>

      2)<!DOCTYPE web-app PUBLIC “-//Sun Microsystems, Inc. //DTD Web Application 2.3//EN”“ http://java.sun.com/dtd/web-app_2.3.dtd”>

● DTD标识名称应符合一些标准的规定,对于ISO标准的DTD一ISO三个字母开头;被改进的非ISo标准的DTD以加号“+”开头;未被改进的非ISO标准的DTD以减号“-”开头。

● 对于一些已经制定成为了行业标准的DTD文件,一些相应的解析器程序可能已经将它们内嵌进去,所以在解析时并不一定要到从指定的URL上进行下载。

范例:

QQ截图20140310210010

3、在XML文档中直接嵌入DTD定义语句

在XML文档中直接嵌入DTD定义语句:

QQ截图20140310211837

引入外部DTD文件的同时加入DTD定义语句:

QQ截图20140310211903

例子:

QQ截图20140310212135

XML文档的组成单元

● XML声明(declaration)

● DOCTYPE声明语句

● 处理指令(processinginstruction)

● 元素(elements)

● 注释(comment)

● CDATA区

4、元素定义

● 语法格式:

       <!ELEMENT 元素名称 使用规则>

● 举例:

       <!ELEMENT 书架(书名,作者,售价)>

       <!ELEMENT 书名(#PCDATA)>

● 使用规则:

  1. (#PCDATA)是parsed character data的简写
  2. (书名,作者,售价)
  3. (书名,#PCDATA)
  4. EMPTY    例如,<!ELEMENT HR EMPTY>定义的元素形式为<HR />
  5. ANY

细节

● DTD使用与XML文档同样的注释方式:<!--注释内容—>

● 每条元素定义语句的顺序是无关紧要的

● 具有不同用途的元素不能使用相同的元素名

● 一个元素的各个组成成份之间可以有各种关系:

      <!ELEMENT MYFILE (TITLE AUTHOR EMAIL)>

      <!ELEMENT MYFILE (TITLE,AUTHOR,EMAIL)>

      <!ELEMENT MYFILE (TITLE|AUTHOR|EMAIL)>

● 在元素的使用规则中可以定义子元素出现的次数:

       (书+)--一次或以上、(书?)--零次或一次、(书*)--零次或以上、(书)—必须仅且只能一次

● 一对圆括号()可用于将括在其中的呢绒组合成一个可统一操作的分组,分组中可以嵌套更小的分组。

        <!ELEMENT MYFILE ((TITLE*,AUTHOR?,EMAIL)*|COMMENT)>

5、属性定义

● 语法格式:

      <!ATTLIST 元素名

              属性名1 属性类型 设置说明

              属性名2 属性类型 设置说明

              ……

      >

● 举例:

      <!ATTLIST 商品

              类别 CDATA #REQUIRED

              颜色 CDATA #IMPLIED

      >

● 应用:

      <商品 类别=“服装” 颜色=“黄色”>…</商品>

      <商品 类别=“服装”>…</商品>

设置说明:

  1. #REQUIRED(必须设置)
  2. #IMPLIED(可有可无)
  3. #FIXED(取值固定为某一个值)
  4. 直接使用默认值

类型:

  1. CDATA
  2. ENUMBERATED
  3. ID
  4. IDREF和IDREFS
  5. NMTOKEN和NMTOKENS
  6. NOTATION
  7. ENTITY和ENTITYS

6、实体定义

● 实体的根本作用是为了一段文本内容创建一个别名,以后在XML文档中就可以多次引用这个别名,XML解析器程序将把XML文档中出现的别名引用转换变成起所对应的文本内容。

● 在DTD定义中,一条<!ENTITY …>语句用于定义一个实体。

● 实体可分为来年各种类型:引用实体和参数实体。

引用实体:

● 语法格式:

  • <!ENTITY 实体名称 “实体内容”>
  • <!ENTITY 实体名称 SYSTEM “外部XML文档的URL”>

● 引用方式:

      &实体名称;

● 举例:

     <!DOCTYPE copyright [

     <!ENTITY copyright SYSTEM “http://www.baidu.com/copyright.xml”>

     ]>

     ……

     &copyright;

参数实体:

● 语法格式:

      <!ENTITY % 实体名称 “实体内容”>

● 引用方式:

      %实体名称;

● 举例1:

     <!ENTITY % TAG_NAMES “姓名|EMAIL|电话|地址”>

     <!ENTITY 个人信息 (%TAG_NAMES;|生日)>

     <!ENTITY 客户信息 (%TAG_NAMES;|公司名)>

● 举例2:

     <!ENTITY % common.attributes

             ‘id ID #IMPLIED

               account CDATA #REQUIRED’

     >

     …

     <!ATTLIST purchaseOrder %common.attributes;>

     <!ATTLIST item %common.attributes;>

三、XML Schema

● XML Schema 与DTD的比较

● 通过一个例子初步认识XML Schema

● 名称空间的概念

●默认名称空间

● 属性的名称空间问题

● 引入XML Schema文档

1、XML Schema 与DTD的比较

● XMLSchema符合XML语法结构

● DOM、SAX等XML API很容易解析出XML Schema文档中的内容。

● XML Schema则采用与XML文档同样的合法性验证机制。

● XML Schema对名称空间支持非常好。

● XML Schema比XML DTD 支持更多的数据类型,并支持用户自定义心得数据类型。

● XML Schema定义约束的能力非常强大,可以对XML实力文档作出细致的语义限制。

● XML Schema 基本上满足了关系模式在数据描述上的需要。

● XML Schema不能像DTD一样定义实体,比DTD更复杂。

2、名称空间的概念

● 遇到的问题

   在不同的约束模式文档中,出现表示不同含义的相同标记名称是完全有可能的。

● 解决

  1. 每个约束模式文档被赋予一个唯一的名称空间,每个名称空间都用一个唯一的URI(统一资源标识符)表示。
  2. 在XMl实力文档中来自不同模式文档的元素增加不同的前缀部分,元素名称前增加的各个前缀部分分别代表各个模式文档的名称空间。

● 举例:

   <xs:schema xmlna:xs=http://www.w3.org/2001/XML Schema”>

          <xs:element name=”书架”>

          …

名称空间的声明

● 基本格式:

       xmlns:前缀名称=“URI”

● 举例:

QQ截图20140311105950

● 在任何元素中声明的名称空间,只对该元素及其中嵌套的所有子孙元素有效,声明名称空间的元素自身上也可以使用代表该名称空间的前缀。

● QName(Qualified Name,限定名)是指用冒号(:)把前缀与本地部分进行分隔的名称,即被限定在了某个名称空间中的名称。

3、默认名称空间

● 基本格式:

   xmlns=“URI”

● 举例:

QQ截图20140311123641

4、属性的名称空间问题

● XML实例文档中通常只需要将元素限定于该模式文档的名称空间中,而不需要将该元素的属性限定在名称空间中。

    例子:

       <xi:include xmlns:xi=”http://www.w3org/2001/XInclude” href=”http://example.com/std/defs parse=”xml” />

● 如果属性名称中有一个前缀部分,该属性将被限定在该前缀所指定的名称空间中。如果属性名称中没有前缀部分,那么该属性就不属于任何名称空间。属性不收默认名称空间的影响。

    例子:

       <x xmlns=”http://www.w3.org “ xmlns:n1=”http://www/w3/org”>

             <good a=”1” n1:a=”2” />

      </x>

xml:space和xml:lang属性

● 前缀名“xml”已经被隐式的绑定到了一个名称空间上,内置属性名称以xml:作为前缀。自定义的属性名不能以xml:作为前缀。

● xml:space属性用于设置下游应用程序应该如何处理解析器传递的空格等字符,设置值只能是“default”或“preserve”。

       <网址 xml:space=”preserve”>     www.google.com   </网址>

● xml:lang属性用于设置元素的本地化语言信息,ISO-639规范中规定了代表各个国家和地区的本地化语言的名称,例如”en“表示英文、”la“表示拉丁文、”zh“表示中文、“zh-CN”表示中文(中国)、“zh-TW”表示中文(台湾地区)。

   例子:

     <product xml:lang=”zh-CN” release-date=”2002-08-18” />

     <product xml:lang=”en-US” release-date=”0-18-2002” />

● 在某个元素中设置了xml:space和xml:lang属性,嵌套在该元素总的子孙元都将沿袭起设置的结果。

5、引入XML Schema文档

使用名称空间 引入XML Schema文档

QQ截图20140311123641

● schemaLocation 属性的设置值包含有两个部分,第一部分就是名称空间的URI,第二部分就是该名称空间所标识的XML Schema文件的位置或URL地址,这两个部分之间用空格分隔。

使用名称空间引入多个XML Schema文档

QQ截图20140311142824

不使用名称空间引用XML Schema文档

QQ截图20140311143240

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!