|
|
|
前页 | 后页 | 目录 | 元素 | 特性 文字目录
下 面 的 一 面 讨 论 围 绕 文 字 的 结 构. 格 式 文 字 的 元 素 (对 齐
元 素, 字 体 元 素, 字 形 元 素 等 等) 将 在 这 份 说 明 书 的 以 后 讨
论. 如 果 有 字符语法 的 问
题 请 参 阅 SGML 部 分.
空白区域SGML 说 明 书 严 格 区 分 开 始 符 (line feeds)?和 结 束 符 (carriage returns). 在 国 际 互 联 网 上, 有 些 平 台 使 用 carriage return line feed 对 来 作 为 换 行, 有 些 只 用 line feeds, 而 有 些 只 用 carriage returns. 因 此, 用 户 代 理 器 应 当 判 定 单 个 的 line feed 和 carriage return 字 符 作 为 换 行 符, 而 carriage return line feed 对 也 应 当 作 为 单 个 的 换 行 符. (译 注: 这 就 是 我 们 常 说 的 ASCII 码 0A 与 OD 的 关 系).紧 跟 着 开 始 标 记 后 出 现 的 换 行 符 应 当 被 忽 略, 在 结 束 标 记 前 的 出 现 换 行 符 也 如 此. 这 个 应 用 对 所 有 的 HTML 没 有 异 常. 额 外 的, 对 所 有 除 PRE 以 外 的 元 素, 邻 近 空 白 区 域 的 序 列 如 空 格, 水 平 TAB, 表 单 结 束 和 换 行 符 均 被 替 换 成 单 个 的 空 格 字 符. 众 多 的 脚 本 (文 字 书 写 语 言) 与 脚 本 间 的 对 空 白 区 域?的 看 法 是 不 同 的, 用 户 代 理 器 应 当 用 脚 本 敏 感 的 方 式 来 解 除 空 白 区 域. 例 如, 对 于 拉 丁 语 脚 本, 一 个 词 的 空 格 就 是 一 个 空 格 (ASCII 10 进 制 码 32), 然 而 在 泰 语 中 是 一 个 0-宽度 的一 个 字 的 单 词 分 隔 符,.在 日 语 和 汉 语 中, 一 个 词 的 空 格 完 全 被 忽 略. 这 些 规 则 允 许 作 来 使 用 空 白 区 域 来 显 示 它 们 希 望 的 标 注, HTML 源 中 的 空 白 区 域 不 会 被?任 何 用 户 代 理 器 渲 染. 例 如, 下 面 的 HTML 源 码: <P> ?This example shows a paragraph and a list. </P> <UL> ?<LI> 牋?This is the <EM>first</EM> item ?</LI> ?<LI> 牋?This is the <EM>second</EM> item ?</LI> </UL> <P>This example shows a paragraph and a list. <UL> ?<LI>This is the <EM>first</EM> item ?<LI>This is the <EM>second</EM> item </UL>?应 当 可 以 被 用 户 代 理 器 相 等 地 渲 染. 单 词 空 格 处 理 能 够 并 用 应 该 在 即 使 缺 少?
lang 特 性 指 定 语 言 信
息 的 情 况 下 也 能 完 成.attribute. 这 是 个 脚 本 问 题, 而 非 语 言
问 题.
结构化文本短语元素:?A NAME="edef-EM">EM,?A NAME="edef-STRONG">STRONG,?A NAME="edef-DFN">DFN,?A NAME="edef-CODE">CODE,?A NAME="edef-SAMP">SAMP,?A NAME="edef-KBD">KBD,?A NAME="edef-VAR">VAR,?A NAME="edef-CITE">CITE, 和?A NAME="edef-ACRONYM">ACRONYM<!ENTITY % phrase "EM | STRONG | DFN | CODE | 牋牋牋牋牋牋牋牋牋 SAMP | KBD | VAR | CITE | ACRONYM"> <!ELEMENT (%font|%phrase) - - (%inline)*> <!ATTLIST (%font|%phrase) ?%attrs;牋牋牋牋牋牋牋牋牋牋牋牋?-- %coreattrs, %i18n, %events -- ?>开 始 标 记: 需 要, 结 束 标 记: 需 要 特 性 在 它 处 定 义
文 字 片 断 的 短 语 可 以 加 上 结 构 化 的 信 息. 主 要 的 短 语 元 素
的 涵 义 如 下:
"More information can be found in <CITE>[ISO-0000]</CITE>." "Please refer to the following reference number in future correspondence: <STRONG>1-234-55</STRONG>"而 ACRONYM 元 素 允 许 作 者 清 清 楚 地 标 识 一 个 组 成 缩 略 语 的 字 符 序 列 (如: "WWW", "FNAC", "IRS", 等 等). 标 识 缩 略 语的 能 力 对 于 拼 写 检 查, 语 音 系 统 , 其 它 的 用 户 代 理 器 而 工 具 来 说 是 有 用 的. 在 ACRONYM 元 素 注 解 中 的 内 容 指 定 了 缩 略 语 的 本 身. title 特 性 可 以 用 来 提 供 哪 个 缩 略 语 被 使 用. 这 里 是 一 些 缩 略 语 定 义 例 程: <ACRONYM title="World Wide Web">WWW</ACRONYM> <ACRONYM? 牋 lang="fr"? 牋 title="Société Nationale de Chemins de Fer"> 牋 SNCF </ACRONYM>短 语 元 素 的 表 现 取 决 于 用 户 代 理 器. 通 常, 可 视 化 用 户 代 理 器 以 斜 体 字 表 现?EM 文 本 并 以 黑 体 来 表 现 STRONG 文 字. 语 音 系 统 用 户 代 理 器 则 调 整 综 合 参 数, 如 音 量, 音 高 和 相 应 的 频 率. 缩 略 语 则 通 过 个 别 的 字 母 分 开 发 音. 注 意: 这 个 版 本 的 HTML 并 没 有 包 含 用 于 缩
写 的 特 殊 的 标 注. 我 们 建 议 语 音 系 统 使 用 客 户 端 字 典 来 展
开 任 何 在 文 档 中 的 缩 写. 对 于 专 业 化 的 词 汇, 文 档 中 LINK
元 素 头 可 以 来 指 定 合 适 的 字 典.
引用 :?A NAME="edef-BLOCKQUOTE">BLOCKQUOTE 和?A NAME="edef-Q">Q 元素<!ELEMENT BLOCKQUOTE - - %block> <!ATTLIST BLOCKQUOTE ?%attrs;牋牋牋牋牋牋牋牋牋牋牋牋?-- %coreattrs, %i18n, %events -- ?cite牋牋牋?%URL牋牋牋 #IMPLIED?-- URL for source document or msg -- ?> <!ELEMENT Q - - (%inline)*> <!ATTLIST Q ?%attrs;牋牋牋牋牋牋牋牋牋牋牋牋?-- %coreattrs, %i18n, %events -- ?cite牋牋牋?%URL牋牋牋 #IMPLIED?-- URL for source document or msg -- ?>开 始 标 记: 需 要, 结 束 标 记 : 需 要 特 性 定 义
在 它 处 定 义 的 特 性
这 里 有 两 个 元 素 来 指 定 引 用 文 字. BLOCKQUOTE
用 来 对 长 引 用 而 Q 有 意 用
来 作 为 没 用 分 段 的 引 用.
这 个 例 程 格 式 选 自 "The Two Towers", 作 者 J.R.R.
Tolkien, 作 为 一 个 封 闭 引 用.
<BLOCKQUOTE cite="http://www.mycom.com/tolkien/twotowers.html"> They went in single file, running like hounds on a strong scent, and an eager light was in their eyes. Nearly due west the broad swath of the marching Orcs tramped its ugly slot; the sweet grass of Rohan had been bruised and blackened as they passed. </BLOCKQUOTE> 引 号 uotation marksI我 们 建 议 使 用 风 格
页 来 决 定 插 入 由 Q 或 BLOCKQUOTE
元 素 限 定 的 引 用 部 分 的 前 后 引 号,?对 于 当 前 语 言 上 下 文 关
系 (see the lang attribute)
以 及 嵌 套 的 引 用 层 次 是 一 种 适 当 的 方 法.
不 过, 一 些 作 者 曾 经 只 把 BLOCKQUOTE 仅 仅 用 于 划 定 文 字, 为 了 保 持 目 前 作 者 的 用 法, 建 议 用 户 代 理 器 不 要 把 引 号 插 入 缺 省 风 格. 此 外, 如 果 作 者 在 Q 或 BLOCKQUOTE 元 素 中 包 含 了 引 号, 用 户 代 理 器 不 应 当 插 入 额 外 的 引 号. 使 用 BLOCKQUOTE 来 划 定 文 字 是 好 的 风 格 页 所 反 对 的. 下标和上标:?A NAME="edef-SUB">SUB 和?A NAME="edef-SUP">SUP 元素<!-- subscripts and superscripts --> <!ELEMENT (SUB|SUP) - - (%inline)*> <!ATTLIST (SUB|SUP) ?%attrs;牋牋牋牋牋牋牋牋牋牋牋牋?-- %coreattrs, %i18n, %events -- ?>开 始 标 记: 需 要, 结 束 标 记: 需 要 在 它 处 定 义 的 特 性
许 多 脚 本 (如 法 语) 需 要 下 标 或 上 标 来 作 适 当 的 渲 染. SUB
和 SUP el元 素 可 以 在 这 些
情 况 下 来 标 注.
这 里, 我 们 使 用 SUP
来 提 高 法 语 单 词 中 的 "Mlle Dupont" 的 "lle".
牋牋?M<sup>lle</sup> Dupont 行和段落作 者 典 型 地 把 他 们 们 的 思 想 和 论 点 分 成 有 序 的 段 落. 对 于 把 信 息 组 织 成 段 落 并 不 受 段 落 内 容 影 响: 左 对 齐 的 段 落 和 双 面 对 齐 的 段 落 表 达 了 相 同 的 论 点.HTML 标 注 对 于 定 义 一 个 段 落 是 直 爽 的: 用 P 元 素 来 定 义 一 个 段 落. 然 后 段 落 的 视 觉 表 现 却 不 是 这 么 简 单. 一 系 列 的 事 项, 风 格 的 和 技 术 上 的, 都 必 须 被 注 意:
段落:?A NAME="edef-P">P 元素<!ELEMENT P - O (%inline)*> <!ATTLIST P ?%attrs;牋牋牋牋牋牋牋牋牋牋牋牋?-- %coreattrs, %i18n, %events -- ?%align;牋牋牋牋牋牋牋牋牋牋牋牋?-- align, text alignment -- ?>开 始 标 记: 需 要, 结 束 标 记:?可 选 在 它 处 定 义 的 特 性
P 元 素 表 示 一 个 段 落. 但 不
能 包 含 一 个 封 闭 级 的 元 素 (包 含 P
自 身). 你 可 以 省 略 结 束 标 记, 然 后 开 始 第 二 个 封 闭 级 的 开
始 标 记. 当 然, 也 结 束 于 附 着 的 P
.
例 如, 下 面 的 两 个 例 程:
空 的 P 元 素 是 坏 的 表 单 并
在 渲 染 时 被 忽 略.
<P>This is the first paragraph.</P> <P>This is the second paragraph.</P> ...a block element...也 可 以 重 写 为 没 有 结 束 标 记: <P>This is the first paragraph. <P>This is the second paragraph. ...a block element...既 然 两 种 都 可 以 在 跟 着 的 封 闭 元 素 之 前 隐 式 的 结 束.?相 同 的, 如 果 一 个 段 落 被 包 含 于 一 个 封 闭 元 素 中, 象 这 样: <DIV> <P>This is the paragraph. </DIV>包 含 封 闭 元 素 的 结 束 标 记 (这 里 是 DIV) 也 隐 式 地 作 为 P 元 素 的 结 束 标 记. 段落的视觉渲染段 落 是 如 何 进 行 视 觉 渲 染 的 取 决 于 用 户 代 理 器. 段 落 经 常 被 渲 染 成 左 边 齐 平 而 右 边 页 缘 粗 糙. 从 右 到 左 的 脚 本 有 其 相 适 宜 的 缺 省 方 式 .HTML 用 户 代 理 器 典 型 地 在 渲 染 时 为 段 落 的 前 后 加 上 空 白 区 域, 例 如: ?At the same time, there began to take form a system of numbering, ?the calendar, hieroglyphic writing, and a technically advanced ?art, all of which later influenced other peoples. ?Within the framework of this gradual evolution or cultural ?progress the Preclassic horizon has been divided into Lower, ?Middle and Upper periods, to which can be added a transitional ?or Protoclassic period with several features that would later ?distinguish the emerging civilizations of Mesoamerica.相 反 的, 在 小 说 中 段 落 的 首 行 缩 进 并 且 段 落 之 间 的 距 离 等 同 于 上 下 的 行 距, 例 如: 牋牋 At the same time, there began to take form a system of ?numbering, the calendar, hieroglyphic writing, and a technically ?advanced art, all of which later influenced other peoples. 牋牋 Within the framework of this gradual evolution or cultural ?progress the Preclassic horizon has been divided into Lower, ?Middle and Upper periods, to which can be added a transitional ?or Protoclassic period with several features that would later ?distinguish the emerging civilizations of Mesoamerica.前 例 中 的 第 2 个 由 NCSA Mosaic 浏 览 器 在 1993 年 推 出, 用 户 代 理 器 通 常 不 对 双 边 页 缘 进 行 调 整, 因 为 没 有 复 杂 的 连 字 惯 例 难 以 有 效 地 完 成. 由 于 风 格 页 和 不 等 宽 字 体 (antialiase font) 的 出 现, 给 HTML 作 者 提 供 了 比 以 前 更 多 的 选 择. 风 格 页 在 尺 寸, 风 格, 页 缘, 段 前 段 后 空 间, 首 行 缩 进, 对 齐 方 式 及 其 它 细 节 上 指 供 了 丰 富 的 控 制. 用 户 代 理 器 的 缺 省 风 格 页 对 在 近 似 的 表 单 中 渲 染?P 元 素, 就 如 同 前 例. 你 原 则 上 可 以 超 越 这 些 常 规 的 段 落 之 间 空 开 的 规 则 来 渲 染 段 落, 但 这 可 能 使 用 户 迷 惑 并 且 是 一 个 坏 的 尝?试. 根 据 约 定, 可 视 化 HTML 用 户 代 理 器 对 文 字 折 行 来 符 合 合 法 的 页 缘. 折 行 运 算 法 则 取 决 于 脚 本 格 式.?!-- See email from Martin about Kanji, Kani, and Thai! --> 例 如, 在 西 文 中 文 字 只 能 在 空 白 处 转 折.老 式 的 用 户 代 理 器 不 正 确 地 在 元 素 的 开 始 (或 结 束) 时 折 行, 结 果 造 成 了 孤 立 的 标 点. 如: ?A statue of the <a href="cih78">Cihuateteus</a>, who are patron ...在 锚 点 结 束 标 记 后 的 折 行 引 起 了 逗 号 被 组 和 到 了 文 字 的 行 首: ?A statue of the Cihuateteus ?, who are patron goddesses ...这 是 一 个 错 误, 即 使 在 那 个 标 注 点 上 并 没 有 空 白 区 域. 控制换行对 于 于 HTML 来 说, 可 以 强 制 换 行 也 可 以 禁 止 换 行.强制换行:?A NAME="edef-BR">BR 元素<!ELEMENT BR - O EMPTY牋牋牋牋?-- forced line break --> <!ATTLIST BR ?%coreattrs;牋牋牋牋牋牋牋牋牋牋?-- id, class, style, title -- ?clear (left|all|right|none) none -- control of text flow -- ?>开 始 标 记: 需 要, 结 束 标 记: 禁 止 BR 元 素 强 制 当 前 文 本 行 的 分 行 (结 束). 对 于 可 视 用 户 代 理 器, clear 特 性 可 用 来 判 断 标 注 是 否 跟 随 于 BR 元 素element flows around images and other objects floated to the left or right margin, 或 者 还 是 在 这 个 物 件 的 底 部 开 始.r whether it starts after the bottom of such objects. 进 一 步 的 细 节 在 对齐方式和物件的浮动 被 给 出. 作 者 被 建 议 使 用 风 格 页 来 控 制 图 像 和 其 它 物 件 的 浮 动. clear 特 性,?根 据 其它 的 HTML 陈 述 和 标 记, 只 有 在 你 认为 用 户 代 理 器 不 提 供 风 格 页 的 时 候 起 适 当 人 用. 在 双 向 格 式 方 面, BR 元 素 应 当 被 作 为 与 Unicode LINE SEPARATOR 字 符 相 同 的 方 式 来 对 待. 禁止换行有 时,?你 可 能 希 望 对 对 两 个 单 词 禁 止 换 行. 字 符 条 目 ( ,  ) 可 以 被 用 作 用 户 代 理 器 不 会 换 行 的 空 格 符.连字符在 HTML 中, 有 两 种 连 字 符: 简 单 连 字 符 和 软 连 字 符. 简 单 连 字 符 可 以 被 用 户 代 理 器 理 解 为 简 单 的 字 符.?而 软 连 字 符 则 可 以 告 诉 用 户 代 理 器 在 这 里 可 以 换 行.那 些 解 释 软 连 字 符 的 浏 览 器 必 须 遵 守 下 列 语 意 学 的 原 则: 如 果 一 行 中 以 连 字 符 分 开, 连 字 符 必 须 显 示 于 第 一 行 的 结 尾. 如 果 一 行 并 不 在 连 字 符 处 换 行, 用 户 代 理 器 则 不 显 示 连 字 符. 对 于 如 搜 寻 和 排 序 的 操 作, 软 连 字 符 应 当 被 忽 略. 在 HTML 中, 简 单 连 字 符 是 "-" 字 符(-, -). 而 软 连 字 符 则 是 命 名 字 符 条 目 ­ (­, ­) 预置文本:?A NAME="edef-PRE">PRE 元素<!ENTITY % pre.exclusion "IMG|BIG|SMALL|SUB|SUP|FONT"> <!ELEMENT PRE - - (%inline)* -(%pre.exclusion)> <!ATTLIST PRE ?%attrs;牋牋牋牋牋牋牋牋牋牋牋牋?-- %coreattrs, %i18n, %events -- ?width牋牋牋 NUMBER牋牋 #IMPLIED ?>开 始 标 记: 需 要, 结 束 标 记: 需 要 特 性 定 义
在 它 处 定 义 的 特 性
PRE?元 素 告 诉 可 视 用 户 代
理 器 那 些 被 包 含 于 "预 处 理" 的 文 本. 用 户 代 理 器 必 须 如 下
对 待 预 处 理 文 本:
上 面 的 DTD 片 断 表 示 哪 些 元 素 不 出 现 于 PRE 声 明. 这 与 HTML 3.2 相 同, 并 且 在 用 组 合 字 体 对 文 字 的 渲 染 时 有 意 地 保 护 行 空 间 及 列 对 齐 方 式. 作 者 通 过 风 格 页 而 改 变 些 行 为 是 被?阻 止 的. 下 面 的 例 程 显 示 了 一 个 预 处 理 的 雪 莱 (译
注: Shelly, 我 想 应 该 翻 作 雪 莱 而 不 是 雪 梨 或 雪 莉) 的 诗: 给
云 雀:
<PRE> 牋牋牋 Higher still and higher 牋牋牋牋 From the earth thou springest 牋牋牋 Like a cloud of fire; 牋牋牋牋 The blue deep thou wingest, And singing still dost soar, and soaring ever singest. </PRE>这 里 是 这 段 诗 文 被 用 户 代 理 器 渲 染 的 效 果: 牋牋牋 Higher still and higher 牋牋牋牋 From the earth thou springest 牋牋牋 Like a cloud of fire; 牋牋牋牋 The blue deep thou wingest, And singing still dost soar, and soaring ever singest. 水 平 制 表 符
水 平 制 表 符 (在 [UNICODE], US ASCII 和 [ISO88591] 解 码 均 为 10 进 制 的 9) 是 通 常 被 用 户 代 理 器 解 译 为 最 小 的 必 须 的 至 制 表 符 结 束 非-0 宽 空 间 为 8 个 字 符. 我 们 强 烈 阻 止 在 预 置 文 本 中 使 用 水 平 制 表 符, 因 为 它 还 在 常 规 测 试 中, 在 编 辑 中, 把 制 表 空 间 设 置 为 其 它 的 值, 会 引 起 文 档 元 法 对 齐. 标注文档改变:?A NAME="edef-ins">INS 和?A NAME="edef-del">DEL 元素<!-- INS/DEL are handled by inclusion on BODY --> <!ELEMENT (INS|DEL) - - (%inline)* -- inserted/deleted text --> <!ATTLIST (INS|DEL) ?%attrs牋牋牋牋牋牋牋牋牋牋牋牋牋 -- %coreattrs, %i18n, %events -- ?cite牋牋牋?%URL牋牋?#IMPLIED牋 -- info on reason for change -- ?datetime牋?CDATA牋牋 #IMPLIED牋 -- when changed: ISO date format -- ?>开 始 标 记: 需 要, 结 束 标 记: 需 要 特 性 定 义
在 它 处 定 义 的 特 性
INS 和 DEL
被 用 来 标 注 文 档 中 的 哪 部 份 相 对 于 原 先 版 本 是 插 入 还 是
删 除 了. (例 如: 法 律 制 定 者 需 要 查 看 草 案 中 的 修 改 部 分).
这 两 个 元 素 通 常 在 HTML 中 既 不 是 封 闭 级 元 素 也 不是 行 内 元 素. 它 们 在 一 段 中 可 以 包 含 一 个 或 更 多 的 单 词 或 包 入 一 个 或 更 多 的 封 闭 级 元 素 如 段 落, 列 表 和 表 格. 用 户 代 理 器 会 明 显 地 来 渲 染 插 入 和 删 除 的 文 字. 例 如, 插 入 的 文 字 可 能 以 一 种 特 殊 字 体 出 现, 而 删 除 文 字 可 能 根 本 不 出 现 或 打 点 或 以 特 殊 标 记 出 现, 等 等. 用 户 代 理 器 如 果 无 法 识 别 DEL 元 素 则 还 是 依 然 如 常 地 渲 染 元 素 中 的 内 容. 日期和时间格式[ISO8601] 在 表 达 时 间 和 日 期 时. 这 份 说 明 书 指 定 了一 种 [ISO8601] 允 许 的 格 式.格 式 为: ?YYYY-MM-DDThh:mm:ssTZD在 此: 牋牋 YYYY = 4 位 数 字 年 份 牋牋 MM牋 = 双 数 字 月 份 (01=1 月, 等 等) 牋牋 DD牋 = 双 数 字 日 期 (从 01 至 31) 牋牋 hh牋 = 双 数 字 小 时 (从 00 至 23) (am/pm 不 被 接 受) 牋牋 mm牋 = 双 数 字 分 钟 (从 00 至 59) 牋牋 ss牋 = 双 数 字 秒 数 (从 00 至 59) 牋牋 TZD?= 时 区 指 示 符时 区 指 示 符 是 以 下 的 一 个:
如 果 一 种 通 常 的 应 用 并 不 知 道 至 秒 的 时 间, 这 个 值 可 能 以 是 "00" (而 分 钟 数 和 小 时 数 是 必 需 的). 所 有 下 列 的 例 程 对 应 于 美 国 西 部 时 间 1994
年 11 月 5 日 上 午 8 点 15 分 50 秒.
牋牋 1994-11-05T13:15:30Z 牋牋 1994-11-05T08:15:30-05:00通 过 使 用 INS, 这 将 给 出: <INS datetime="1994-11-05T08:15:30-05:00"> I added this on November 5th </INS>
|