DTD 构建模块

创建于 2024-12-03 / 21
字体: [默认] [大] [更大]

XML和HTML文档的主要构建模块是元素。


XML文档的构建模块

从DTD的角度来看,所有XML文档都由以下构建模块组成:

  • 元素
  • 属性
  • 实体
  • PCDATA
  • CDATA

元素

元素是XML和HTML文档的主要构建模块。

HTML元素的例子有"body"和"table"。XML元素的实例可以是"note"和"message"。元素可以包含文本、其他元素或为空。空HTML元素的例子有"hr"、"br"和"img"。

实例:

<body>some text</body>

<message>some text</message>

属性

属性提供有关元素的额外信息。

属性总是放在元素的开始标记内。属性总是以名称/值对的形式出现。以下是"img"元素具有有关源文件的其他信息:

<img src="computer.gif" />

元素的名称是 "img"。 属性的名称是 "src"。 该属性的值为 "computer.gif"。由于元素本身为空,因此由 " /" 关闭。



实体

有些字符在XML中有特殊的含义,比如定义XML标记开头的小于号(<)。

大多数人都知道HTML实体:"&nbsp;"。这个"no-breaking-space"实体在HTML中用于在文档中插入额外的空格。当XML解析器解析文档时,实体被展开。

以下实体是用XML预定义的:

实体引用 Character
&lt; <
&gt; >
&amp; &
&quot; "
&apos; '

PCDATA

PCDATA 表示已解析的字符数据。

将字符数据视为在XML元素的开始标记和结束标记之间找到的文本。

PCDATA是将由解析器解析的文本. 解析器将检查文本中的实体和标记.

文本中的标记将被视为标记,实体将被展开.

但是,解析的字符数据不应包含任何&, <, or >字符;这些需要由&amp; &lt; and &gt;实体。


CDATA

CDATA表示字符数据。

CDATA是解析器不会解析的文本. 文本中的标记不会被视为标记,实体也不会展开。



0 人点赞过