XMLidP2000

Sitemap

Sitemap

1 Einführung
1.1 Warum mehr weniger ist
1.2 Warum mehr mehr ist
1.3 Wohin die Reise geht
2 Was sind Dokumente?
2.1 Eine kurze Geschichte der Textverarbeitung
2.2 Bestandteile eines Dokumentes
2.3 Die neue, alte Idee: Strukturorientiert schreiben
2.4 Die Entwicklung des Hypertextes
2.5 Textformate im Web
2.6 Das SGML-Konzept: Generic Markup
2.7 Dokumente versus Daten
3 XML im Web
3.1 XML bei der Verwaltung von Websites
3.2 Clientseitige XML-Interpretation
3.2.1 XML mit CSS
3.2.2 XML mit XSL(T)
3.3 XML auf dem Server
3.4 Linking-Möglichkeiten von XML
3.5 XML als Datenaustauschformat
4 XML Quick Start
4.1 Dokumenttyp-Definition (DTD) und Instanzen
4.2 Verarbeitung der Dokumente
4.2.1 Beispiel: Verarbeitung mit Cost/TCL
4.2.2 Beispiel: Verarbeitung mit XSLT
4.2.3 Beispiel: XML/XSLT im Internet Explorer
4.2.4 Fazit
5 XML-DTDs: Die verständliche Beschreibung
5.1 Ein Wort zur Notation
5.2 Dokumente
5.3 Elemente
5.4 Zeichen, Namen und Zeichendaten
5.5 Kommentare
5.6 Processing Instructions
5.7 Wo bleibt Multimedia?
5.8 Dokumenttyp-Definition (DTD)
5.8.1 Elementtyp-Deklaration
5.8.2 Attributlisten-Deklaration
5.8.3 Möglichkeiten, die DTD zu gestalten und zu gliedern
5.8.4 Notation-Deklaration
6 Namensräume in XML
7 XPath: Adressierung von XML-Dokumentteilen
7.1 Zu Grunde liegendes Datenmodell
7.2 Zugriff auf den Datenbaum
7.3 Hilfe von Operatoren
7.4 Kernfunktionen für den Datenzugriff
8 XML: Linking
8.1 Notwendige Begriffe
8.2 XLink: einfache und erweiterte Links
8.2.1 Einfache Verweise
8.2.2 Erweiterte Links
8.2.3 XLink in der Praxis
8.3 XPointer: Verweise in Dokumente hinein
8.3.1 XPath-Erweiterungen in XPointer
9 Überblick über Stylesheet-Sprachen
9.1 Cascading Style Sheets
9.1.1 Wertzuweisungen
9.1.2 Formatierungsmodell
9.1.3 CSS und XML
9.1.4 Ein Beispiel: XML im Mozilla
9.2 Document Style Semantics and Specification Language
9.2.1 Flow Objects
9.2.2 Verarbeitungs-Modus
9.2.3 DSSSL praktisch
9.2.4 Langer Marsch von DSSSL nach HTML
9.3 Extensible Stylesheet Language (XSLT und XSL)
9.3.1 Verhältnis von XSLT zu XSL
9.3.2 Formatierung mit XSL
10 XSL-Transformationen
10.1 Grundsätzliches über Templates
10.2 Ergänzungen zum Datenmodell von XPath
10.3 Struktur von XSLT-Stylesheets
10.4 Den Ergebnisbaum erzeugen
10.4.1 Diverse Basiselemente
10.4.2 Formatierte Nummerierung
10.4.3 Schleifen und bedingte Verarbeitung
10.4.4 Sortieren
10.4.5 Variable und Parameter
10.4.6 Zusätzliche Funktionen
10.4.7 XSLT-Erweiterungen
10.4.8 message, output
11 XSLT in Web-Anwendungen
11.1 XSLT im Internet Explorer
11.2 Linklisten erzeugen
11.3 Details einer Literaturgeschichte
11.3.1 Sortierte Überblicksseiten
11.3.2 Kalender: einzelne Tage ausgeben
12 XML-Editoren
12.1 Übersicht
12.1.1 Emacs + PSGML (mit XML-Unterstützung)
12.1.2 XML Notepad
12.1.3 XML Spy
12.1.4 XMetal
12.1.5 Epic
12.1.6 MarkupKit (für MS Word)
12.1.7 WordPerfect Office2000
12.2 Emacs und PSGML (mit XML-Unterstützung)
12.3 XML-Notepad
12.4 XML Spy
12.5 XMetal
12.6 Epic
12.7 MarkupKit (für MS Word)
12.8 WordPerfect Office2000
12.9 Fazit
13 Entwicklung einer DTD
13.1 Auswahl einer Mehrzweck-DTD
13.2 Entwurf einer DTD
13.2.1 Dokumentanalyse
13.2.2 Tipps und Tricks
13.3 Instanzen ohne DTD
14 Herstellung dieses Buches
14.1 Zielsetzung und Randbedingungen
14.2 Definition der DTD
14.2.1 Schritt 1: Die Grobstruktur
14.2.2 Schritt 2: Elemente auf Zeichenebene
14.2.3 Schritt 3: Die Details
14.3 Formatieren des Manuskriptes
14.3.1 Konvertierung in HTML
14.3.2 Aufbereitung für den Ausdruck
14.4 Erfahrungen mit der zweiten Auflage
15 Anwendungsbeispiel Literatur
15.1 Vorüberlegungen
15.2 En détail: die Autoren in der DTD
15.3 Wie die Daten ins Web gelangen
15.3.1 Inhaltsverzeichnis generieren
15.3.2 Ausgabe der Autorendaten
15.4 Vollständige Listings
15.4.1 DTD für die Literaturgeschichte
15.4.2 DSSSL-Listing: Inhaltsverzeichnis
15.4.3 DSSSL-Listing: Ausgabe eines einzelnen Autors
15.4.4 Perl-Code für Ausgabe einzelner Autoren
16 Verteilte Softwareverwaltung mit XML
16.1 Aufgabenbeschreibung
16.2 XML als Datenbasis
16.3 Bilden von DTD-Hierarchien
16.4 Zusammentragen von verteilten XML-Fragmenten
16.5 Fazit
16.6 Stylesheet zur Transformation in HTML
17 E-Commerce mit XML
17.1 B2B-E-Commerce
17.1.1 Die Rolle von XML
17.1.2 Technische Aspekte
17.2 BMEcat
17.3 Electronic Business XML (ebXML)
17.3.1 Arbeitsgruppen
17.3.2 Zeitplan des Projekts
17.4 XML und EDIFACT
18 XML und Apache
18.1 XML-Transformation per CGI
18.1.1 Konfiguration des Servers
18.1.2 CGI-Skript: xmlhandler.cgi
18.1.3 Beispiel: von HTML nach HTML mit DSSSL oder XSLT
18.2 Cocoon
18.2.1 Extensible Server Pages (XSP)
18.2.2 Beispiel: Formatierung in PDF mit XSL
18.2.3 Beispiel: Simuliertes XLink mit Dynamic HTML/JavaScript
18.2.4 Installation
19 XHTML: Neues HTML 4 — erweiterbar
19.1 Status quo: HTML neu definiert
19.2 Modulare Zukunft
20 Transformation von XML in WML und HTML
20.1 Erzeugen der WML-Dateien
20.2 Erzeugen der HTML-Dateien
21 Ausblick
21.1 XML Schema
21.2 Programmierung mit XML-Daten
21.3 XML und Java
21.4 Resource Description Framework
21.5 Die Zukunft
A Extensible Markup Language (XML) 1.0
A.1 Einleitung
A.1.1 Herkunft und Ziele
A.1.2 Terminologie
A.2 Dokumente
A.2.1 Wohlgeformte XML-Dokumente
A.2.2 Zeichen
A.2.3 Allgemeine syntaktische Konstrukte
A.2.4 Zeichendaten und Markup
A.2.5 Kommentare
A.2.6 Processing Instructions
A.2.7 CDATA-Abschnitte
A.2.8 Prolog und Dokumenttyp-Deklaration
A.2.9 Standalone-Dokumentdeklaration
A.2.10 Behandlung von Leerraum
A.2.11 Behandlung des Zeilenendes
A.2.12 Identifikation der Sprache
A.3 Logische Strukturen
A.3.1 Start-Tags, End-Tags und Leeres-Element-Tags
A.3.2 Elementtyp-Deklarationen
A.3.3 Attributlisten-Deklaration
A.3.4 Bedingte Abschnitte
A.4 Physikalische Strukturen
A.4.1 Zeichen- und Entity-Referenzen
A.4.2 Entity-Deklarationen
A.4.3 Analysierte Entities
A.4.4 Behandlung von Entities und Referenzen durch einen XML-Prozessor
A.4.5 Konstruktion des Ersetzungstextes von internen Entities
A.4.6 Vordefinierte Entities
A.4.7 Notation-Deklarationen
A.4.8 Dokument-Entity
A.5 Konformität
A.5.1 Validierende und nicht-validierende Prozessoren
A.5.2 Benutzen von XML-Prozessoren
A.6 Notation
A.7 Anhang A: Referenzen
A.7.1 Normative Referenzen
A.7.2 Weitere Referenzen
A.8 Anhang B: Zeichenklassen
A.9 Anhang C: XML und SGML (nicht normativ)
A.10 Anhang D: Expansion von Entity- und Zeichenreferenzen (nicht normativ)
A.11 Anhang E: Deterministische Inhaltsmodelle (nicht normativ)
A.12 Anhang F: Automatische Erkennung von Zeichenkodierungen (nicht normativ)
A.13 Anhang G: XML-Arbeitsgruppe des W3C (nicht normativ)
B Verknüpfen von Style Sheets mit XML-Dokumenten Version 1.0
B.1 Die xml-stylesheet-Processing-Instruction
B.2 Anhang A: Referenzen
B.3 Anhang B: Begründung
C Verhältnis von XML zu SGML und HTML
C.1 XML und SGML
C.2 XML und HTML
D Übersichten
D.1 Cascading Style Sheets
D.1.1 CSS-Eigenschaften und -Werte
D.1.2 CSS-Muster
D.2 DSSSL: Flow Objects
D.3 Syntax der XSLT-Elemente
D.4 DTD-Fragment für XSLT-Stylesheets (nicht normativ)
D.5 Relevante Spezifikationen und Organisationen
D.5.1 International Organization for Standardization
D.5.2 World Wide Web Consortium
D.5.3 Organization for the Advancement of Structured Information Standards
D.5.4 Internet Society und Internet Engineering Task Force
D.5.5 ISO-639-Sprachcodes
D.5.6 ISO-3166-Ländercodes
D.5.7 Zeichensatz ISO-Latin-1
D.5.8 Sonderzeichen
D.6 XML-1.0-Regeln

6 Namensräume in XML

But if I bought a radio and found that it accessed only certain stations and not others, I'd be upset. I suppose I could have a half dozen radios, one for each set of stations. It makes no more sense to have a half dozen computers or different operating systems or browsers for Web access.FussnoteDas aus [bern99] [bern99]Weaving the Web - The Original Design an Ultimate Destiny of the World Wide Web by its Inventor - The Original Design an Ultimate Destiny of the World Wide Web by its Inventor, Tim Berners-Lee, Mark Fischetti, San Francisco, 1999, HarperSanFrancisco stammende Zitat lautet übersetzt: Wenn ich ein Radio kaufte und herausfände, dass ich nur bestimmte Sender empfangen kann, andere aber nicht, wäre ich sauer. Wahrscheinlich könnte ich ein halbes Dutzend Radios haben, immer eins für ein paar Sender. Es ist nicht sinnvoller, ein halbes Dutzend Rechner oder unterschiedliche Betriebssysteme oder Browser für den Webzugang zu haben.

Tim Berners-Lee

Namensraum ist zwar für Programmierer im objektorientierten Umfeld ein möglicherweise vertrauter Begriff, aber in Webautorenkreisen dürfte der Begriff eher Verwirrung auslösen. Es handelt sich dabei um eine vom W3C im Januar 1999 als Empfehlung verabschiedete Regelung, wie Elemente in XML-Dokumenten zu bezeichnen sind, wenn sie aus unterschiedlichen Zusammenhängen (DTDs) stammen. Ein einfaches Beispiel soll das illustrieren.

<!-- Adresse 1 -->

<adresse>
  <strasse>Schneller Weg</strasse>
  <hausnummer>99</hausnummer>
  <plz>12345</plz>
  <ort>Woauchimmer</ort>
</adresse>

<!-- Adresse 2 -->

<rechner>
  <domain>auchschonweg.de</domain>
  <name>meinrechner</name>
  <adresse>168.111.222.333</adresse>
</rechner>
      

Wollte man die unterschiedlich gemeinten Adressen in einem Dokument verwenden — und bei technischer Dokumentation wäre das ja zumindest möglich —, wäre völlig unklar, was ein Element adresse beinhalten darf und soll. Weil dieses Problem der Zuordnung von Elementen zu einem Inhaltsmodell beziehungsweise einem Namensraum aus Sicht des Konsortiums unbedingt gelöst werden musste, ist die Empfehlung für XML-Namensräume gleich die erste nach der XML-Syntax gewesen, die in diesem Umfeld verabschiedet wurde. Mittlerweile hat sich das dahinter stehende Konzept so weit durchgesetzt, dass beispielsweise XSLT ohne diese Namensräume kaum denkbar wäre (siehe Kapitel 10).

Ein QName ist aus einem lokalen Teil und einem den Namensraum benennenden Präfix zusammengesetzt

Es geht um Elemente und Attribute. Und es geht darum, wie man diese beiden beschreiben soll, ohne dass Konflikte auftreten, welches Element aus welcher DTD gemeint ist. Dazu hat das W3-Konsortium den so genannten qualifizierenden Namen (QName) eingeführt, der aus einem optionalen Präfix und einem lokalen Namen besteht. Das Präfix bezeichnet den Namensraumteil, der lokale Teil besteht aus dem Element- oder Attributnamen, wie er in der DTD steht. Dazwischen steht ein Doppelpunkt. Innerhalb des Dokuments, in dem diese QNames verwendet werden, muss eine Deklaration stattfinden, die klar macht, dass ein Präfix mit einem bestimmten Namensraum-URI assoziiert ist. Dazu verwendet man ein Attribut: entweder xmlns oder xmlns:. Eines vorweg: Alle Buchstabenfolgen, die mit xml beginnen (auch als Großbuchstaben) sind insofern geschützt, als das W3C sich vorbehält, sie im XML-Umfeld für Spezifikationszwecke zu nutzen.

Beispiel
<html xmlns="http://www.w3.org/TR/REC-html40">
  <body>
    <div class="wild_colours">
      <person xmlns:mensch="http://www.auchschonweg.de/"
        anrede="Frau">
        <mensch:name>
        ...
        </mensch:name>
      </person>
    </div>
  </body>
</html>
      

In der ersten Zeile des Listings ist dem Element html der Namensraum von HTML 4.0 zugewiesen worden. Das Fehlen des Doppelpunkts bewirkt, dass es sich im Folgenden (= in html und allen in diesem enthaltenen Elementen) per Default um diesen Namensraum handelt, ohne dass das jedesmal notiert werden müsste (zum Beispiel body). Das Element person hingegen — durch xmlns: deklariert — hat der Zeichenkette mensch als Präfix den Wert des folgenden Namensraum-URI zugewiesen, sodass innerhalb von person mit mensch:name die weitere Verwendung dieses Namensraums möglich ist. Nach dem Schließen des Elements person gilt wieder der Default-Namensraum (hier der in html vereinbarte); es sei denn, ein neuer wird zugewiesen.

Hinweis

James Clark hat eine einleuchtende Notation dafür gefunden, wie die Namensraumzugehörigkeit sich darstellen lässt [clark99] [clark99]XML Namespaces, James Clark, 1999, http://www.jclark.com/xmlns.htm. Obiges Listing sähe nach seiner Beschreibung aus wie das folgende:

<{http://www.w3.org/TR/REC-html40}html>
  <{http://www.w3.org/TR/REC-html40}body>
    <{http://www.w3.org/TR/REC-html40}div
        class="wild_colours">
      <{http://www.auchschonweg.de/}person
          anrede="Frau">
        <{http://www.auchschonweg.de/}name>
          ...
        </{http://www.auchschonweg.de/}name>
      </{http://www.auchschonweg.de/}person>
    <{http://www.w3.org/TR/REC-html40}div>
  </{http://www.w3.org/TR/REC-html40}body>
</{http://www.w3.org/TR/REC-html40}html>
      

Um einem Missverständnis vorzubeugen: Der Namensraum-URI hat keinerlei festgelegte Bedeutung, dass heißt, dass hinter ihm nicht ein Dokument in einer bestimmten Form zu stehen hat. Der URI ist pure Konvention. Dass in der beim W3C vorliegenden HTML-Spezifikation in einem Unterverzeichnis tatsächlich eine DTD zu finden ist, dürfte eher die Ausnahme sein, wie der zweite URI zeigt, denn er verweist lediglich auf eine (hier beliebig gewählte) Website, nicht auf ein Dokument.

Vorsicht!

Was das Listing in Clarks Notation vielleicht noch deutlicher zeigt als das davor stehende, ist, dass Attribute nicht automatisch den Namensraum des zugehörigen Elements erhalten: anrede="Frau" im obigen Beispiel verfügt über keinen Namensraum. Das gilt auch im Falle eines Default-Namensraums. Soll also das Attribut den Namensraum mensch haben, muss man ihn ihm explizit zuweisen:

<person xmlns:mensch="http://www.auchschonweg.de/"
  mensch:anrede="Frau">
      

oder

<{http://www.auchschonweg.de/}person
  {http://www.auchschonweg.de/}anrede="Frau"
      

In manchen Fällen kann es sinnvoll sein, auf einen Default-Namensraum zu verzichten, weil sich dann ein zugewiesenes Präfix verwenden lässt (hier mensch). Denn wenn der Default-Namensraum der von HTML ist, haben Attribute wie class keinen Namensraum.

Elemente können durchaus unterschiedliche Namensräume deklarieren, die man in ihnen verwenden darf:

<html xmlns:html="http://www.w3.org/TR/REC-html40"
    xmlns:mensch="http://www.auchschonweg.de/">
  <html:body>
    <html:div class="wild_colours">
      <mensch:person mensch:anrede="Frau">
        <mensch:name>
        ...
        </mensch:name>
      </mensch:person>
    </html:div>
  </html:body>
</html:html>
      

Auch hier gilt, dass das Attribut class keinen Namensraum besitzt, während mensch:anrede="Frau" das Attribut mit dem zugewiesenen mensch versieht. Um auch class einen Namensraum zuzuweisen, müsste es html:class="wild_colours" heißen. Beachtenswert ist außerdem, dass Elemente nicht Attribute gleichen Namens enthalten dürfen (also nicht anrede="Frau" anrede="Mrs"). Und Präfixe in unterschiedlichen QNames, die denselben lokalen Teil haben, dürfen nicht auf denselben Namensraum verweisenFussnoteVergleich dazu auch die Ausführungen zu Attributlisten-Deklarationen in Abschnitt A.3.3 der XMl-Spezifikation im Anhang.. Folgendes ist demnach falsch:

Vorsicht!
<person xmlns:erstes="http://www.auchschonweg.de/"
    xmlns:mensch="http://www.auchschonweg.de/">
<person mensch:anrede="Frau"
        erstes:anrede="Mrs">
  <mensch:name>
    ...
  </mensch:name>
</mensch:person>

Sowohl das Präfix erstes als auch mensch verweisen auf denselben Namensraum, und der lokale Teil ist mit anrede ebenfalls identisch.

Valid HTML 4.01!Valid CSS!