A.6 Notation
Die formale Grammatik von XML ist in
dieser Spezifikation unter Verwendung einer einfachen
Erweiterten Backus-Naur-Form
(EBNF) notiert. Jede Regel der Grammatik
definiert ein Symbol in der folgenden Form:
Symbol ::= Ausdruck
Symbole beginnen mit einem großen Anfangsbuchstaben,
falls sie durch einen regulären Ausdruck definiert sind,
sonst mit einem kleinen Anfangsbuchstaben. Literale
Zeichenketten sind in Anführungszeichen
eingeschlossen.
Innerhalb des Ausdrucks auf der rechten Seite der
Regel werden die folgenden Ausdrücke verwendet, um Muster von
einem oder mehr Zeichen anzugeben:
- #xN
- wobei N eine ganze Hexadezimalzahl ist. Dieser Ausdruck
passt zu dem Zeichen aus ISO/IEC 10646, dessen
kanonischer (UCS-4-) Code bei Interpretation
als vorzeichenlose (unsigned) Binärzahl den Wert N hat. Die
Anzahl der führenden Nullen in #xN ist unwichtig. Die Anzahl
der führenden Nullen im korrespondierenden Code ist durch
die Zeichenkodierung vorgegeben und für XML
unerheblich.
- [a-zA-Z], [#xN-#xN]
- passt zu jedem Zeichen mit einem Code innerhalb und
inklusive des/der angegebenen Intervalle(s).
- [^a-z], [^#xN-#xN]
- passt zu jedem Zeichen außerhalb des Intervalls.
- [^abc], [^#xN#xN#xN]
- passt zu jedem Zeichen, das nicht zu den genannten gehört.
- "zeichenkette"
- passt zu der literalen Zeichenkette, die innerhalb der
doppelten Anführungszeichen angegeben ist.
- 'zeichenkette'
- passt zu der literalen Zeichenkette, die innerhalb der
einfachen Anführungszeichen (Apostroph) angegeben ist.
Diese Symbole können auf folgende Weise kombiniert
werden, um komplexere Muster zu bilden. A und B stellen
jeweils einfach Ausdrücke dar.
- (ausdruck)
- ausdruck wird als Einheit betrachtet und
kann, wie in dieser Liste beschrieben, kombiniert werden.
- A?
- passt zu A oder nichts; optionales A.
- A B
- passt zu A, gefolgt von B.
- A | B
- passt zu A oder B, aber nicht zu beidem.
- A - B
- passt zu jeder Zeichenkette, die zu A passt, aber nicht zu
B.
- A+
- passt zu einfachem oder mehrfachem Vorkommen von A.
- A*
- passt zu null-, ein- oder mehrfachem Vorkommen von A.
Weitere in den Produktionen benutzte Notationen
sind:
- /* ... */
- Kommentar
- [WGB: ... ]
- Wohlgeformtheitsbeschränkung. Diese identifiziert durch
einen Namen eine mit einer Produktion verknüpfte
Beschränkung eines wohlgeformten Dokuments.
- [GKB: ... ]
- Gültigkeitsbeschränkung. Diese identifiziert durch
einen Namen eine mit einer Produktion verknüpfte
Beschränkung eines gültigen Dokuments.