|
实体
有五种预定义的XML实体,HTML编码者应该熟悉。XML文档中的字符&、、"和'被分别表示为&、@lt;、>、"和'。
XML很大程度上扩展了实体的功能 - 允许在DTD中定义实体以便在文档的其余部分使用。例如,我在XML文档中需要频繁使用词组"Wired Digital",可以在DTD中这样表示:
这样当我使用这个词组时,可以敲入&wd;。于是可以避免拼错和重复敲入相同的信息。实体可以起到字处理器中宏的作用。
被替换的文本可以任意长,但是如果真是很长,可能要把信息存储在另一个文件中。可以通过外部实体参考来实现 - 在实体名和文件的URL中使用关键字SYSTEM:
这些特征功能强大,但有一个缺点:在一个DTD内不能被扩展。为了实现扩展功能,需要一个称为参数实体的特殊工具。它在实体定义中通过在实体名前插入"%"实现。一旦被定义,参数定义可以通过用百分号和分号包围参数名来实现。
为什么这么做?看看下面的代码:
这段代码来自一个公用的XML名片草稿。当定义根元素时,作者发现更容易把信息分离到不同的参数实体中。如果看看其中的一个实体表现,我们就会知道为什么了。看看下面的prop.id实体:
如果每个实体都用这么长的字符串表示,元素定义将很难阅读。
现在可以读一些DTD了。
Jay Greenspan ISO-8859-1 Entities
Named
Entity Numeric
Entity Glyph Description
-
unused
horizontaltab
linefeed
unused
space
! ! exclamationmark
" " " doublequotationmark
# # numbersign
$ $ dollarsign
% % percentsign
& & & amperstand
' ' apostrophe
( ( leftparenthesis
) ) rightparenthesis
* * asterisk
+ + plussign
, , comma
- - hyphen
. . period(fullstop)
Named
Entity Numeric
Entity Glyph Description
/ / solidus(slash)
0-
9 digits0-9
: : colon
; ; semicolon
> > greater-thansign
? ? questionmark
@ @ commercialat
A-
Z letters A-Z
[ ][ leftsquarebracket
\ \ reversesolidus(backslash)
] ] rightsquarebracket
^ ^ caret
_ _ horizontalbar(underscore)
` ` acuteaccent
a-
z letters a-z
{ { leftcurlybrace
| | verticalbar
Named
Entity Numeric
Entity Glyph Description
} } rightcurlybrace
~ ~ tilde
-
? unused
non-breakingspace
? ? invertedexclamation
¢ ¢ centsign
£ £ poundsterling
¤ ¤ generalcurrencysign
¥ ¥ yensign
| | brokenverticalbar
§ § sectionsign
¨ ¨ umlaut(dieresis)
? ? ? copyright
a a feminineordinal
? ? leftanglequote, guillemotleft
? ? notsign
- - softhyphen
? ? registeredtrademark
ˉ ˉ macronaccent
Named
Entity Numeric
Entity Glyph Description
° ° degreesign
± ± plusorminus
2 2 superscripttwo
3 3 superscriptthree
′ ′ acuteaccent
μ μ microsign
? ? paragraphsign
· · middledot
? ? cedilla
1 1 superscriptone
o o masculineordinal
? ? rightanglequote, guillemotright
? ? one-fourth
? ? one-half
? ? three-fourths
? ? invertedquestionmark
à à à uppercaseA, graveaccent
á á á uppercaseA, acuteaccent
? ? ? uppercaseA, circumflexaccent
Named
Entity Numeric
Entity Glyph Description
? ? ? uppercaseA, tilde
? ? ? uppercaseA, dieresisorumlautmark
? ? ? uppercaseA, ring
? ? ? uppercaseAEdipthong(ligature)
? ? ? uppercaseC, cedilla
è è è uppercaseE, graveaccent
é é é uppercaseE, acuteaccent
ê ê ê uppercaseE, circumflexaccent
? ? ? uppercaseE, dieresisorumlautmark
ì ì ì uppercaseI, graveaccent
í í í uppercaseI, acuteaccent
? ? ? uppercaseI, circumflexaccent
? ? ? uppercaseI, dieresisorumlautmark
D D D uppercaseEth, Icelandic
? ? ? uppercaseN, tilde
ò ò ò uppercaseO, graveaccent
ó ó ó uppercaseO, acuteaccent
? ? ? uppercaseO, circumflexaccent
? ? ? uppercaseO, tilde
Named
Entity Numeric
Entity Glyph Description
? ? ? uppercaseO, dieresisorumlautmark
× × multiplysign
? ? ? uppercaseO, slash
ù ù ù uppercaseU, graveaccent
ú ú ú uppercaseU, acuteaccent
? ? ? uppercaseU, circumflexaccent
ü ü ü uppercaseU, dieresisorumlautmark
Y Y Y uppercaseY, acuteaccent
T T T uppercaseTHORN, Icelandic
? ? ? lowercasesharps, German(szligature)
à à à lowercasea, graveaccent
á á á lowercasea, acuteaccent
a a a lowercasea, circumflexaccent
? ? ? lowercasea, tilde
? ? ? lowercasea, dieresisorumlautmark
? ? ? lowercasea, ring
? ? ? lowercaseaedipthong(ligature)
? ? ? lowercasec, cedilla
è è è lowercasee, graveaccent
Named
Entity Numeric
Entity Glyph Description
é é é lowercasee, acuteaccent
ê ê ê lowercasee, circumflexaccent
? ? ? lowercasee, dieresisorumlautmark
ì ì ì lowercasei, graveaccent
í í í lowercasei, acuteaccent
? ? ? lowercasei, circumflexaccent
? ? ? lowercasei, dieresisorumlautmark
e e e lowercaseeth, Icelandic
? ? ? lowercasen, tilde
ò ò ò lowercaseo, graveaccent
ó ó ó lowercaseo, acuteaccent
? ? ? lowercaseo, circumflexaccent
? ? ? lowercaseo, tilde
? ? ? lowercaseo, dieresisorumlautmark
÷ ÷ divisionsign
? ? ? lowercaseo, slash
ù ù ù lowercaseu, graveaccent
ú ú ú lowercaseu, acuteaccent
? ? ? lowercaseu, circumflexaccent
Named
Entity Numeric
Entity Glyph Description
ü ü ü lowercaseu, dieresisorumlautmark
y y y lowercasey, acuteaccent
t t t lowercasethorn, Icelandic
? ? ? lowercasey, dieresisorumlautmark |
|