Dieser Abschnitt definiert einige Symbole, die innerhalb der Grammatik häufig Verwendung finden.
SLeerraum Definition:LeerraumSDefinition:S (Leerraum, White Space) besteht aus einem oder mehreren Leerzeichen (#x20), Wagenrückläufen, Zeilenvorschüben oder Tabulatoren.
Leerraum | ||||
---|---|---|---|---|
|
Zeichen sind aus Gründen der Bequemlichkeit als Buchstaben, Ziffern und andere Zeichen klassifiziert. Buchstaben bestehen aus einem führenden alphabetischen oder Silbenzeichen, möglicherweise gefolgt von einem oder mehreren kombinierenden Zeichen oder von einem ideografischen Zeichen. Die vollständige Definition der einzelnen Zeichen in jeder Klasse ist in A.8 aufgeführt.
Ein Name ist ein TokenEin Token
ist ein Zeichen bzw. eine Zeichenfolge, das bzw. die für einen
Parser eine syntaktische Einheit darstellt bzw. darstellen., das mit einem
Buchstaben (letter) oder einem erlaubten Interpunktionszeichen
beginnt, woran sich Buchstaben, Ziffern (digit),
Bindestriche,
Unterstriche, Doppelpunkte oder Punkte anschließen. Letztere
sind als Name-Zeichen bekannt. Namen, die mit
xml
oder mit einer Zeichenkette beginnen,
die zu (('X'|'x') ('M'|'m') ('L'|'l')) passt, sind
für die Standardisierung in dieser oder einer zukünftigen
Version dieser Spezifikation reserviert.
Hinweis: Der Doppelpunkt ist innerhalb von XML-Namen für Experimente mit Namensräumen reserviert. Es ist zu erwarten, dass seine Bedeutung irgendwann in der Zukunft standardisiert wird. Es könnte dann notwendig sein, Dokumente, die mit dem Doppelpunkt experimentieren, zu aktualisieren. (Es gibt keine Garantie, dass ein Mechanismus für Namensräume in XML tatsächlich den Doppelpunkt als Trennzeichen für Namensräume verwendet.) Praktisch bedeutet das, dass Autoren den Doppelpunkt in XML-Namen außer zu Namensraum-Versuchen nicht einsetzen sollten, dass aber XML-Prozessoren den Doppelpunkt als Name-Zeichen akzeptieren sollten.
Ein Nmtoken (Name Token) ist eine beliebige Kombination von Name-Zeichen.
Namen und Token | ||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
Ein Literal ist eine beliebige, in
AnführungszeichenDer Begriff des
Anführungszeichens
(double quotes) bezeichnet innerhalb der übersetzten
Spezifikation die auf Computer-Tastaturen zu findenden
hochgestellten
Anführungszeichen, die nicht wie im Deutschen zwischen tiefgestellter
Anführung (öffnendes Zeichen) und hochgestellter
Abführung (schließendes Zeichen)
unterscheiden. Gleiches gilt für das einfache
Anführungszeichen
(single quotes) im englischen
Originaltext. Dies haben wir in der
Übersetzung gelegentlich als Apostroph
bezeichnet, da
es sich um das
gleiche Zeichen (auf der Tastatur) handelt, wenngleich es
nicht die Funktion des Apostrophs (Auslassung) erfüllt. Wir
haben hier dem Pragmatismus Vorrang vor typografischer
Exaktheit gegeben.
eingeschlossene Zeichenkette, die nicht das
Anführungszeichen enthält, das zur Begrenzung der
Zeichenkette verwendet wird. Literale werden verwendet, um
den Inhalt von internen Entities (EntityValue),
die Werte von Attributen (AttValue) und um externe
Bezeichner (SystemLiteral) anzugeben. Beachten
Sie, dass ein SystemLiteral analysiert (parsed)
werden kann, ohne nach Markup zu suchen.
Literale | ||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|