XMLidP2000

Sitemap

Sitemap

1 Einführung
1.1 Warum mehr weniger ist
1.2 Warum mehr mehr ist
1.3 Wohin die Reise geht
2 Was sind Dokumente?
2.1 Eine kurze Geschichte der Textverarbeitung
2.2 Bestandteile eines Dokumentes
2.3 Die neue, alte Idee: Strukturorientiert schreiben
2.4 Die Entwicklung des Hypertextes
2.5 Textformate im Web
2.6 Das SGML-Konzept: Generic Markup
2.7 Dokumente versus Daten
3 XML im Web
3.1 XML bei der Verwaltung von Websites
3.2 Clientseitige XML-Interpretation
3.2.1 XML mit CSS
3.2.2 XML mit XSL(T)
3.3 XML auf dem Server
3.4 Linking-Möglichkeiten von XML
3.5 XML als Datenaustauschformat
4 XML Quick Start
4.1 Dokumenttyp-Definition (DTD) und Instanzen
4.2 Verarbeitung der Dokumente
4.2.1 Beispiel: Verarbeitung mit Cost/TCL
4.2.2 Beispiel: Verarbeitung mit XSLT
4.2.3 Beispiel: XML/XSLT im Internet Explorer
4.2.4 Fazit
5 XML-DTDs: Die verständliche Beschreibung
5.1 Ein Wort zur Notation
5.2 Dokumente
5.3 Elemente
5.4 Zeichen, Namen und Zeichendaten
5.5 Kommentare
5.6 Processing Instructions
5.7 Wo bleibt Multimedia?
5.8 Dokumenttyp-Definition (DTD)
5.8.1 Elementtyp-Deklaration
5.8.2 Attributlisten-Deklaration
5.8.3 Möglichkeiten, die DTD zu gestalten und zu gliedern
5.8.4 Notation-Deklaration
6 Namensräume in XML
7 XPath: Adressierung von XML-Dokumentteilen
7.1 Zu Grunde liegendes Datenmodell
7.2 Zugriff auf den Datenbaum
7.3 Hilfe von Operatoren
7.4 Kernfunktionen für den Datenzugriff
8 XML: Linking
8.1 Notwendige Begriffe
8.2 XLink: einfache und erweiterte Links
8.2.1 Einfache Verweise
8.2.2 Erweiterte Links
8.2.3 XLink in der Praxis
8.3 XPointer: Verweise in Dokumente hinein
8.3.1 XPath-Erweiterungen in XPointer
9 Überblick über Stylesheet-Sprachen
9.1 Cascading Style Sheets
9.1.1 Wertzuweisungen
9.1.2 Formatierungsmodell
9.1.3 CSS und XML
9.1.4 Ein Beispiel: XML im Mozilla
9.2 Document Style Semantics and Specification Language
9.2.1 Flow Objects
9.2.2 Verarbeitungs-Modus
9.2.3 DSSSL praktisch
9.2.4 Langer Marsch von DSSSL nach HTML
9.3 Extensible Stylesheet Language (XSLT und XSL)
9.3.1 Verhältnis von XSLT zu XSL
9.3.2 Formatierung mit XSL
10 XSL-Transformationen
10.1 Grundsätzliches über Templates
10.2 Ergänzungen zum Datenmodell von XPath
10.3 Struktur von XSLT-Stylesheets
10.4 Den Ergebnisbaum erzeugen
10.4.1 Diverse Basiselemente
10.4.2 Formatierte Nummerierung
10.4.3 Schleifen und bedingte Verarbeitung
10.4.4 Sortieren
10.4.5 Variable und Parameter
10.4.6 Zusätzliche Funktionen
10.4.7 XSLT-Erweiterungen
10.4.8 message, output
11 XSLT in Web-Anwendungen
11.1 XSLT im Internet Explorer
11.2 Linklisten erzeugen
11.3 Details einer Literaturgeschichte
11.3.1 Sortierte Überblicksseiten
11.3.2 Kalender: einzelne Tage ausgeben
12 XML-Editoren
12.1 Übersicht
12.1.1 Emacs + PSGML (mit XML-Unterstützung)
12.1.2 XML Notepad
12.1.3 XML Spy
12.1.4 XMetal
12.1.5 Epic
12.1.6 MarkupKit (für MS Word)
12.1.7 WordPerfect Office2000
12.2 Emacs und PSGML (mit XML-Unterstützung)
12.3 XML-Notepad
12.4 XML Spy
12.5 XMetal
12.6 Epic
12.7 MarkupKit (für MS Word)
12.8 WordPerfect Office2000
12.9 Fazit
13 Entwicklung einer DTD
13.1 Auswahl einer Mehrzweck-DTD
13.2 Entwurf einer DTD
13.2.1 Dokumentanalyse
13.2.2 Tipps und Tricks
13.3 Instanzen ohne DTD
14 Herstellung dieses Buches
14.1 Zielsetzung und Randbedingungen
14.2 Definition der DTD
14.2.1 Schritt 1: Die Grobstruktur
14.2.2 Schritt 2: Elemente auf Zeichenebene
14.2.3 Schritt 3: Die Details
14.3 Formatieren des Manuskriptes
14.3.1 Konvertierung in HTML
14.3.2 Aufbereitung für den Ausdruck
14.4 Erfahrungen mit der zweiten Auflage
15 Anwendungsbeispiel Literatur
15.1 Vorüberlegungen
15.2 En détail: die Autoren in der DTD
15.3 Wie die Daten ins Web gelangen
15.3.1 Inhaltsverzeichnis generieren
15.3.2 Ausgabe der Autorendaten
15.4 Vollständige Listings
15.4.1 DTD für die Literaturgeschichte
15.4.2 DSSSL-Listing: Inhaltsverzeichnis
15.4.3 DSSSL-Listing: Ausgabe eines einzelnen Autors
15.4.4 Perl-Code für Ausgabe einzelner Autoren
16 Verteilte Softwareverwaltung mit XML
16.1 Aufgabenbeschreibung
16.2 XML als Datenbasis
16.3 Bilden von DTD-Hierarchien
16.4 Zusammentragen von verteilten XML-Fragmenten
16.5 Fazit
16.6 Stylesheet zur Transformation in HTML
17 E-Commerce mit XML
17.1 B2B-E-Commerce
17.1.1 Die Rolle von XML
17.1.2 Technische Aspekte
17.2 BMEcat
17.3 Electronic Business XML (ebXML)
17.3.1 Arbeitsgruppen
17.3.2 Zeitplan des Projekts
17.4 XML und EDIFACT
18 XML und Apache
18.1 XML-Transformation per CGI
18.1.1 Konfiguration des Servers
18.1.2 CGI-Skript: xmlhandler.cgi
18.1.3 Beispiel: von HTML nach HTML mit DSSSL oder XSLT
18.2 Cocoon
18.2.1 Extensible Server Pages (XSP)
18.2.2 Beispiel: Formatierung in PDF mit XSL
18.2.3 Beispiel: Simuliertes XLink mit Dynamic HTML/JavaScript
18.2.4 Installation
19 XHTML: Neues HTML 4 — erweiterbar
19.1 Status quo: HTML neu definiert
19.2 Modulare Zukunft
20 Transformation von XML in WML und HTML
20.1 Erzeugen der WML-Dateien
20.2 Erzeugen der HTML-Dateien
21 Ausblick
21.1 XML Schema
21.2 Programmierung mit XML-Daten
21.3 XML und Java
21.4 Resource Description Framework
21.5 Die Zukunft
A Extensible Markup Language (XML) 1.0
A.1 Einleitung
A.1.1 Herkunft und Ziele
A.1.2 Terminologie
A.2 Dokumente
A.2.1 Wohlgeformte XML-Dokumente
A.2.2 Zeichen
A.2.3 Allgemeine syntaktische Konstrukte
A.2.4 Zeichendaten und Markup
A.2.5 Kommentare
A.2.6 Processing Instructions
A.2.7 CDATA-Abschnitte
A.2.8 Prolog und Dokumenttyp-Deklaration
A.2.9 Standalone-Dokumentdeklaration
A.2.10 Behandlung von Leerraum
A.2.11 Behandlung des Zeilenendes
A.2.12 Identifikation der Sprache
A.3 Logische Strukturen
A.3.1 Start-Tags, End-Tags und Leeres-Element-Tags
A.3.2 Elementtyp-Deklarationen
A.3.3 Attributlisten-Deklaration
A.3.4 Bedingte Abschnitte
A.4 Physikalische Strukturen
A.4.1 Zeichen- und Entity-Referenzen
A.4.2 Entity-Deklarationen
A.4.3 Analysierte Entities
A.4.4 Behandlung von Entities und Referenzen durch einen XML-Prozessor
A.4.5 Konstruktion des Ersetzungstextes von internen Entities
A.4.6 Vordefinierte Entities
A.4.7 Notation-Deklarationen
A.4.8 Dokument-Entity
A.5 Konformität
A.5.1 Validierende und nicht-validierende Prozessoren
A.5.2 Benutzen von XML-Prozessoren
A.6 Notation
A.7 Anhang A: Referenzen
A.7.1 Normative Referenzen
A.7.2 Weitere Referenzen
A.8 Anhang B: Zeichenklassen
A.9 Anhang C: XML und SGML (nicht normativ)
A.10 Anhang D: Expansion von Entity- und Zeichenreferenzen (nicht normativ)
A.11 Anhang E: Deterministische Inhaltsmodelle (nicht normativ)
A.12 Anhang F: Automatische Erkennung von Zeichenkodierungen (nicht normativ)
A.13 Anhang G: XML-Arbeitsgruppe des W3C (nicht normativ)
B Verknüpfen von Style Sheets mit XML-Dokumenten Version 1.0
B.1 Die xml-stylesheet-Processing-Instruction
B.2 Anhang A: Referenzen
B.3 Anhang B: Begründung
C Verhältnis von XML zu SGML und HTML
C.1 XML und SGML
C.2 XML und HTML
D Übersichten
D.1 Cascading Style Sheets
D.1.1 CSS-Eigenschaften und -Werte
D.1.2 CSS-Muster
D.2 DSSSL: Flow Objects
D.3 Syntax der XSLT-Elemente
D.4 DTD-Fragment für XSLT-Stylesheets (nicht normativ)
D.5 Relevante Spezifikationen und Organisationen
D.5.1 International Organization for Standardization
D.5.2 World Wide Web Consortium
D.5.3 Organization for the Advancement of Structured Information Standards
D.5.4 Internet Society und Internet Engineering Task Force
D.5.5 ISO-639-Sprachcodes
D.5.6 ISO-3166-Ländercodes
D.5.7 Zeichensatz ISO-Latin-1
D.5.8 Sonderzeichen
D.6 XML-1.0-Regeln

18.2 Cocoon

Unter dem Namen Cocoon wurde von Stefano Mazzocchi und anderen im Rahmen des Java Apache Project ein Java-Servlet zum XML-basierten Web-Publishing entwickelt. Mittlerweile gibt es ein eigenes Apache XML Project (http://xml.apache.org/). Die Idee hinter Cocoon ist die gleiche wie zuvor: XML-Fähigkeit in den Server übertragen. Genauer heißt das, dass ein Dokument unter Trennung seiner Komponenten Inhalt (Text, Grafik usw.), logische Struktur (etwa Gliederungen) und Darstellung (z.B. Formatierung am Bildschirm oder für Print-Ausgabe) verarbeitet wird. Dies ist genau die Idee, die in SGML und letzlich auch in XML eingeflossen ist. Die Grundfunktionen von Cocoon entsprechen ungefähr der zuvor beschriebenen CGI-Variante. Im Gegensatz dazu ist Cocoon jedoch (als Servlet) ein Bestandteil des Servers und baut außerdem auf offenenen W3C-Standards auf. Der modulare Aufbau erlaubt außerdem weitergehende Anwendungen, wie sich später zeigen wird.

Vereinfachtes Verarbeitungsmodell von Cocoon

Abbildung 67: Vereinfachtes Verarbeitungsmodell von Cocoon

Der Ablauf der Verarbeitung in Cocoon ist recht einfach und in Abbildung 67 dargestellt. Ein als Datei vorliegendes XML-Dokument wird von einem Parser in eine interne Baumdarstellung, das Document Object Model (DOM), überführt. Auf dieser Datenstruktur arbeitet ein XSL(T)-Prozessor und erzeugt eine Ausgabe. Diese allgemeine Beschreibung ist auch tatsächlich so allgemein implementiert. Durch die Verwendung von Standardschnittstellen lassen sich die verwendeten Programme austauschen — sie müssen allerdings in Java geschrieben sein. Als Parser unterstützt Cocoon zurzeit (Februar 2000) Apache XercesFussnoteXerces basiert auf dem Parser von IBM. und Sun ProjectX. Als XSLT-Prozessoren stehen zur Verfügung Apache Xalan und James Clarks XT. Zur PDF-Erzeugung dient James Taubers Fop, der mittlerweile als Apache Fop auch Teil des Apache-Projekts ist.

Browser-Erkennung in Cocoon

Um lediglich XML-Dateien on the fly in HTML zu wandeln, kann man genau so vorgehen, wie oben bei der CGI-Lösung beschrieben. In die XML-Dateien wird die Processing Instruction für das Stylesheet eingetragen, und Cocoon wandelt, zusammen mit dem Parser und dem XSLT-Prozessor, die Daten in HTML. Allerdings hat Cocoon noch mehr zu bieten. Die W3C-Empfehlung zur Verknüpfung von Dokumenten mit Stylesheets (Anhang B ) definiert für die Processing Instruction ein Pseudoattribut namens media. Damit lässt sich eine Ausgabe für verschiedene Browser realisieren. In der XML-Datei sieht das zum Beispiel so aus:

Beispiel
<?xml version="1.0"?>
<?xml-stylesheet href="graphics.xsl" type="text/xsl"?>
<?xml-stylesheet href="textonly.xsl" type="text/xsl" media="lynx"?>

...

Mit diesen Anweisungen benutzt Cocoon das Stylesheet textonly.xsl für den Browser lynx und für alle anderen Browser das Stylesheet graphics.xsl. Um den Browser zu erkennen, analysiert das Programm die HTTP-Header-Zeile User-Agent. In Abhängigkeit der darin enthaltenen, vom Browser an den Server übermittelten Informationen erfolgt dann die Zuordnung zu einem Stylesheet. Folgende Browsernamen sind in Cocoon voreingestellt:

explorer
für Microsoft Internet Explorer; sucht nach MSIE
opera
für Opera
lynx
für Lynx
java
für Java-Programme, die Standard-URL-Klassen verwenden (aus java.net.*)
wap
für den Nokia WAP Toolkit Browser
netscape
für Netscape Navigator; sucht nach Mozilla

Diese Zuordnungen lassen sich in der Konfiguration leicht ändern. Die nötigen Einträge stehen in der Datei cocoon.properties.

Dynamisch erzeugte Dokumente

Mit dem bis hier beschriebenen System kann man nun also statische XML-Dateien an einen HTML-Browser ausliefern. Vor dem Hintergrund von Erweiterungen wie Server Side Includes (SSI), PHP u.a, die zum Standardrepertoire gehören, stellt sich bald die Frage, wie man denn dynamisch erzeugte Dokumentteile mit XML/Cocoon realisieren kann. Cocoon bietet als Rahmensystem die Möglichkeit, als mittlere Komponente in der Verarbeitungskette verschiedene so genannte Prozessoren einzusetzen. Diese Prozessoren arbeiten auf einer DOM-Datenstruktur. Es lassen sich mehrere solcher Prozessoren in Reihe schalten, vergleichbar zum Einsatz der Pipe in Unix-Shells (vgl. Abbildung 68). Einen der Prozessoren wollen wir hier noch näher betrachten, nämlich den XSP-Prozessor.

Cocoon: Verschiedene Prozessoren, die auf
      DOM-Daten arbeiten

Abbildung 68: Cocoon: Verschiedene Prozessoren, die auf DOM-Daten arbeiten

Zuvor noch ein Wort dazu, wie Cocoon bestimmt, welcher Prozessor (und später welcher Formatierer) benutzt werden soll. Zu diesem Zweck gibt es zwei spezielle Processing Instructions der folgenden Form:

Referenz
<?cocoon-process type="xxx"?> 

<?cocoon-format type="yyy"?>

Die erste Zeile legt fest, welcher Prozessor benutzt werden soll und die zweite Zeile bestimmt den Formatierer. Dazu nur zwei kleine Beispiele aus der Cocoon-Dokumentation:

Beispiel
<?cocoon-process type="xslt"?>

<?cocoon-format type="text/xslfo"?>

In diesem Beispiel wird das Dokument vom XSLT-Prozessor verarbeitet (erste Zeile) beziehungsweise vom Formatierer für text/xslfo (Formatting Objects) formatiert (zweite Zeile).

Wir wollen hier nicht zu sehr auf die Vor- und Nachteile der Cocoon-PIs eingehen. Einerseits haben wir uns bereits an anderer Stelle über grundsätzliche Schwächen von PIs ausgelassenFussnoteNicht vergessen: PIs sind böse :-) und andererseits sehen selbstverständlich auch die Cocoon-Entwickler die Probleme. Als Folge davon wird bereits jetzt in der Cocoon-FAQ angekündigt, dass die PIs durch eine saubere Lösung ersetzt werden. Das heißt nicht, dass die heutige Realisierung nicht mehr funktionieren wird, sondern, dass es mit Cocoon 2 hoffentlich eine bessere Alternative gibt. Für die sofortige Verwendung sind die PIs eine schnelle und pragmatische Lösung, aber eben nicht mehr. Da nicht abzusehen ist, wann Cocoon 2 erscheint, sollten Sie unbedingt auf der Website nachsehen.

Herunter 18.2.1 Extensible Server Pages (XSP)
Herunter 18.2.2 Beispiel: Formatierung in PDF mit XSL
Herunter 18.2.3 Beispiel: Simuliertes XLink mit Dynamic HTML/JavaScript
Herunter 18.2.4 Installation

Valid HTML 4.01!Valid CSS!