XMLidP2000

Sitemap

Sitemap

1 Einführung
1.1 Warum mehr weniger ist
1.2 Warum mehr mehr ist
1.3 Wohin die Reise geht
2 Was sind Dokumente?
2.1 Eine kurze Geschichte der Textverarbeitung
2.2 Bestandteile eines Dokumentes
2.3 Die neue, alte Idee: Strukturorientiert schreiben
2.4 Die Entwicklung des Hypertextes
2.5 Textformate im Web
2.6 Das SGML-Konzept: Generic Markup
2.7 Dokumente versus Daten
3 XML im Web
3.1 XML bei der Verwaltung von Websites
3.2 Clientseitige XML-Interpretation
3.2.1 XML mit CSS
3.2.2 XML mit XSL(T)
3.3 XML auf dem Server
3.4 Linking-Möglichkeiten von XML
3.5 XML als Datenaustauschformat
4 XML Quick Start
4.1 Dokumenttyp-Definition (DTD) und Instanzen
4.2 Verarbeitung der Dokumente
4.2.1 Beispiel: Verarbeitung mit Cost/TCL
4.2.2 Beispiel: Verarbeitung mit XSLT
4.2.3 Beispiel: XML/XSLT im Internet Explorer
4.2.4 Fazit
5 XML-DTDs: Die verständliche Beschreibung
5.1 Ein Wort zur Notation
5.2 Dokumente
5.3 Elemente
5.4 Zeichen, Namen und Zeichendaten
5.5 Kommentare
5.6 Processing Instructions
5.7 Wo bleibt Multimedia?
5.8 Dokumenttyp-Definition (DTD)
5.8.1 Elementtyp-Deklaration
5.8.2 Attributlisten-Deklaration
5.8.3 Möglichkeiten, die DTD zu gestalten und zu gliedern
5.8.4 Notation-Deklaration
6 Namensräume in XML
7 XPath: Adressierung von XML-Dokumentteilen
7.1 Zu Grunde liegendes Datenmodell
7.2 Zugriff auf den Datenbaum
7.3 Hilfe von Operatoren
7.4 Kernfunktionen für den Datenzugriff
8 XML: Linking
8.1 Notwendige Begriffe
8.2 XLink: einfache und erweiterte Links
8.2.1 Einfache Verweise
8.2.2 Erweiterte Links
8.2.3 XLink in der Praxis
8.3 XPointer: Verweise in Dokumente hinein
8.3.1 XPath-Erweiterungen in XPointer
9 Überblick über Stylesheet-Sprachen
9.1 Cascading Style Sheets
9.1.1 Wertzuweisungen
9.1.2 Formatierungsmodell
9.1.3 CSS und XML
9.1.4 Ein Beispiel: XML im Mozilla
9.2 Document Style Semantics and Specification Language
9.2.1 Flow Objects
9.2.2 Verarbeitungs-Modus
9.2.3 DSSSL praktisch
9.2.4 Langer Marsch von DSSSL nach HTML
9.3 Extensible Stylesheet Language (XSLT und XSL)
9.3.1 Verhältnis von XSLT zu XSL
9.3.2 Formatierung mit XSL
10 XSL-Transformationen
10.1 Grundsätzliches über Templates
10.2 Ergänzungen zum Datenmodell von XPath
10.3 Struktur von XSLT-Stylesheets
10.4 Den Ergebnisbaum erzeugen
10.4.1 Diverse Basiselemente
10.4.2 Formatierte Nummerierung
10.4.3 Schleifen und bedingte Verarbeitung
10.4.4 Sortieren
10.4.5 Variable und Parameter
10.4.6 Zusätzliche Funktionen
10.4.7 XSLT-Erweiterungen
10.4.8 message, output
11 XSLT in Web-Anwendungen
11.1 XSLT im Internet Explorer
11.2 Linklisten erzeugen
11.3 Details einer Literaturgeschichte
11.3.1 Sortierte Überblicksseiten
11.3.2 Kalender: einzelne Tage ausgeben
12 XML-Editoren
12.1 Übersicht
12.1.1 Emacs + PSGML (mit XML-Unterstützung)
12.1.2 XML Notepad
12.1.3 XML Spy
12.1.4 XMetal
12.1.5 Epic
12.1.6 MarkupKit (für MS Word)
12.1.7 WordPerfect Office2000
12.2 Emacs und PSGML (mit XML-Unterstützung)
12.3 XML-Notepad
12.4 XML Spy
12.5 XMetal
12.6 Epic
12.7 MarkupKit (für MS Word)
12.8 WordPerfect Office2000
12.9 Fazit
13 Entwicklung einer DTD
13.1 Auswahl einer Mehrzweck-DTD
13.2 Entwurf einer DTD
13.2.1 Dokumentanalyse
13.2.2 Tipps und Tricks
13.3 Instanzen ohne DTD
14 Herstellung dieses Buches
14.1 Zielsetzung und Randbedingungen
14.2 Definition der DTD
14.2.1 Schritt 1: Die Grobstruktur
14.2.2 Schritt 2: Elemente auf Zeichenebene
14.2.3 Schritt 3: Die Details
14.3 Formatieren des Manuskriptes
14.3.1 Konvertierung in HTML
14.3.2 Aufbereitung für den Ausdruck
14.4 Erfahrungen mit der zweiten Auflage
15 Anwendungsbeispiel Literatur
15.1 Vorüberlegungen
15.2 En détail: die Autoren in der DTD
15.3 Wie die Daten ins Web gelangen
15.3.1 Inhaltsverzeichnis generieren
15.3.2 Ausgabe der Autorendaten
15.4 Vollständige Listings
15.4.1 DTD für die Literaturgeschichte
15.4.2 DSSSL-Listing: Inhaltsverzeichnis
15.4.3 DSSSL-Listing: Ausgabe eines einzelnen Autors
15.4.4 Perl-Code für Ausgabe einzelner Autoren
16 Verteilte Softwareverwaltung mit XML
16.1 Aufgabenbeschreibung
16.2 XML als Datenbasis
16.3 Bilden von DTD-Hierarchien
16.4 Zusammentragen von verteilten XML-Fragmenten
16.5 Fazit
16.6 Stylesheet zur Transformation in HTML
17 E-Commerce mit XML
17.1 B2B-E-Commerce
17.1.1 Die Rolle von XML
17.1.2 Technische Aspekte
17.2 BMEcat
17.3 Electronic Business XML (ebXML)
17.3.1 Arbeitsgruppen
17.3.2 Zeitplan des Projekts
17.4 XML und EDIFACT
18 XML und Apache
18.1 XML-Transformation per CGI
18.1.1 Konfiguration des Servers
18.1.2 CGI-Skript: xmlhandler.cgi
18.1.3 Beispiel: von HTML nach HTML mit DSSSL oder XSLT
18.2 Cocoon
18.2.1 Extensible Server Pages (XSP)
18.2.2 Beispiel: Formatierung in PDF mit XSL
18.2.3 Beispiel: Simuliertes XLink mit Dynamic HTML/JavaScript
18.2.4 Installation
19 XHTML: Neues HTML 4 — erweiterbar
19.1 Status quo: HTML neu definiert
19.2 Modulare Zukunft
20 Transformation von XML in WML und HTML
20.1 Erzeugen der WML-Dateien
20.2 Erzeugen der HTML-Dateien
21 Ausblick
21.1 XML Schema
21.2 Programmierung mit XML-Daten
21.3 XML und Java
21.4 Resource Description Framework
21.5 Die Zukunft
A Extensible Markup Language (XML) 1.0
A.1 Einleitung
A.1.1 Herkunft und Ziele
A.1.2 Terminologie
A.2 Dokumente
A.2.1 Wohlgeformte XML-Dokumente
A.2.2 Zeichen
A.2.3 Allgemeine syntaktische Konstrukte
A.2.4 Zeichendaten und Markup
A.2.5 Kommentare
A.2.6 Processing Instructions
A.2.7 CDATA-Abschnitte
A.2.8 Prolog und Dokumenttyp-Deklaration
A.2.9 Standalone-Dokumentdeklaration
A.2.10 Behandlung von Leerraum
A.2.11 Behandlung des Zeilenendes
A.2.12 Identifikation der Sprache
A.3 Logische Strukturen
A.3.1 Start-Tags, End-Tags und Leeres-Element-Tags
A.3.2 Elementtyp-Deklarationen
A.3.3 Attributlisten-Deklaration
A.3.4 Bedingte Abschnitte
A.4 Physikalische Strukturen
A.4.1 Zeichen- und Entity-Referenzen
A.4.2 Entity-Deklarationen
A.4.3 Analysierte Entities
A.4.4 Behandlung von Entities und Referenzen durch einen XML-Prozessor
A.4.5 Konstruktion des Ersetzungstextes von internen Entities
A.4.6 Vordefinierte Entities
A.4.7 Notation-Deklarationen
A.4.8 Dokument-Entity
A.5 Konformität
A.5.1 Validierende und nicht-validierende Prozessoren
A.5.2 Benutzen von XML-Prozessoren
A.6 Notation
A.7 Anhang A: Referenzen
A.7.1 Normative Referenzen
A.7.2 Weitere Referenzen
A.8 Anhang B: Zeichenklassen
A.9 Anhang C: XML und SGML (nicht normativ)
A.10 Anhang D: Expansion von Entity- und Zeichenreferenzen (nicht normativ)
A.11 Anhang E: Deterministische Inhaltsmodelle (nicht normativ)
A.12 Anhang F: Automatische Erkennung von Zeichenkodierungen (nicht normativ)
A.13 Anhang G: XML-Arbeitsgruppe des W3C (nicht normativ)
B Verknüpfen von Style Sheets mit XML-Dokumenten Version 1.0
B.1 Die xml-stylesheet-Processing-Instruction
B.2 Anhang A: Referenzen
B.3 Anhang B: Begründung
C Verhältnis von XML zu SGML und HTML
C.1 XML und SGML
C.2 XML und HTML
D Übersichten
D.1 Cascading Style Sheets
D.1.1 CSS-Eigenschaften und -Werte
D.1.2 CSS-Muster
D.2 DSSSL: Flow Objects
D.3 Syntax der XSLT-Elemente
D.4 DTD-Fragment für XSLT-Stylesheets (nicht normativ)
D.5 Relevante Spezifikationen und Organisationen
D.5.1 International Organization for Standardization
D.5.2 World Wide Web Consortium
D.5.3 Organization for the Advancement of Structured Information Standards
D.5.4 Internet Society und Internet Engineering Task Force
D.5.5 ISO-639-Sprachcodes
D.5.6 ISO-3166-Ländercodes
D.5.7 Zeichensatz ISO-Latin-1
D.5.8 Sonderzeichen
D.6 XML-1.0-Regeln

9.2.3 DSSSL praktisch

Grundsätzlich unterscheidet DSSSL sich von CSS dadurch, dass erstere eine richtige Programmiersprache enthält. Mit ihr lassen sich außer Angaben über Schriftgröße und -typ auch Berechnungen vornehmen. Das klingt zwar gut, aber leider ist die Sprache recht kompliziert, so dass man sie Web-Autoren kaum zumuten kann. Wer sich als HTML-Kenner daran gewöhnen muss, mit neuen Sprachen (= DTDs) zu arbeiten oder gar die Strukturbeschreibung selbst erst zu entwerfen, der will sich möglicherweise nicht auch noch mit Lisp belasten.

Innerhalb der Stilsprache existieren zwei Teilbereiche, die entwickelt beziehungsweise spezifiziert worden sind, weil der gesamte Umfang anscheinend zu groß war, als dass mit seiner vollständigen Implementierung zu rechnen gewesen wäre. Die Core Query Language und die Core Expression Language stellen dar, was in einer DSSSL-Implementierung zwingend ist.

Jade: von XML nach HTML mit James' DSSSL Engine

DSSSL-Implementierungen gibt es auch frei verfügbar. Hier dürfte James Clarks Jade unter anderem deshalb am verbreitetsten sein, weil diese DSSSL-Maschine für mehrere Betriebssysteme (Unix-Derivate inklusive Linux plus Win32) vorhanden ist — außerdem ist sie kostenlos erhältlich. Jade beinhaltet zwar nicht alles, was die DSSSL-Spezifikation bietet, aber es ist ein hervorragendes Tool, um etwa XML- oder SGML-Dokumente in HTML zu wandeln. Ein Beispiel weiter unten wird dies zeigen.

Für eine beliebige DTD muss der zuständige Stylesheet-Schreiber abhängig vom gewünschten Ergebnis festlegen, welche Elemente wie darzustellen sind — oder ob sie übergangen werden. Letzteres erreicht man durch:

Beispiel
(element wasauchimmer 
    (empty-sosofo))

In CSS hieße dieser Ausdruck:

wasauchimmer { display: none }
SOSOFO: Spezifikation einer Folge von Flow Objects

Hinter einem SOSOFO steckt eine Specification of a Sequence of a Flow ObjectFussnoteObwohl Spezifikation weiblich ist, verwenden wir hier den männliche Artikel für das Akronym. Im Grunde entspricht dies nur dem Sprachgefühl der Autoren (der Duden kennt das Wort nicht), aber die Wortendung und das schließende Object fördern diesen Sprachgebrauch.. Obiges Beispiel ist ein Sonderfall, nämlich das leere SOSOFO. Die oben gezeigte Elementfunktion sieht formaler so aus:

Beispiel
(element elementname SOSOFO)
DSSSL: mehr als nur ein Stylesheet

Ein DSSSL-Stylesheet heißt eigentlich Spezifikation, vor allem deshalb, weil es mehr als nur Stilvorgaben enthalten kann, wie sich in wenigen MinutenFussnoteVorausgesetzt, Sie lesen in diesem Kapitel konsequent weiter, anstatt gerade Kaffee holen zu wollen, weil die vielen Klammern, die dieses Kapitel noch enthalten wird, Sie schrecken. Keine Sorge, sie (die Klammern) werden alle wieder geschlossen ... deutlicher zeigen wird. Deutlicher, weil schon das obige Beispiel (Ausgabe der Elementposition) mehr ist als eine reine Stilvorgabe. Vordefinierte DSSSL-Funktionen gibt es zu viele, als dass wir sie hier alle auflisten könnten.

Eigene Funktion in Stylesheets nutzen

Prinzipiell lassen sich alle DSSSL-Funktionen innerhalb eines Stylesheets nutzen. Darüber hinaus kann man eigene Funktionen programmieren, die dann Bestandteil des Stylesheets sind. Das folgende Beispiel zeigt zwei Jade fehlende Funktionen, die so wörtlich der DSSSL-Spezifikation entnommen sind. Mit ihrer Hilfe lässt sich die Ausgabe der Position eines Elements realisieren. Sie aus dem Standard-Dokument zu übernehmen, resultierte aus der Arbeit mit Jade respektive der Tatsache, dass James Clark eben nicht alles aus dem DSSSL-Standard implementiert hat. Die DSSSL-Spezifikation enthält noch mehr an Beispielen.

Beispiel
; ----- node-list-length + node-list-reduce

(define (node-list-reduce nl combine init)
	(if (node-list-empty? nl)
	    init
	    (node-list-reduce (node-list-rest nl)
		  combine
	          (combine init (node-list-first nl)))))

(define (node-list-length nl)
	(node-list-reduce nl
		(lambda (result snl) 
			(+ result 1))
			0))

Die Einzelheiten der Scheme-Programmierung können wir hier leider nicht erläutern; ein paar Anmerkungen zu den Funktionen müssen genügen: node-list-reduce erhält als Parameter eine Node List (Knoten in der internen Dokumentrepräsentation), einen Funktionsnamen und einen initialen Wert. Falls die Knotenliste leer ist, wird der Anfangswert ausgegeben. Ansonsten ruft node-list-reduce sich rekursiv auf, und zwar mit der durch node-list-rest um den ersten Node verkürzten Liste, dem Funktionsnamen sowie einem Aufruf dieser Funktion. node-list-length ruft node-list-rest mit der Node-List, einer Lambda-Funktion sowie dem Anfangswert auf. Ausgegeben wird schließlich der Wert, den init in node-list-reduce zum Schluss hat.

Hinweis

Zum Trost für alle, denen die DSSSL-Spezifikation selbst zu weit geht: Die hier versammelten Beispiele sind für ein solches Kapitel kompliziert genug. Ein weiteres (15) wird zwei vollständige Style Sheets für eine kleine Anwendung vorstellen, die auch online auszuprobieren sind.

Eigene Funktionen in DSSSL-Style-Sheets zu verwenden erfordert deren Formulierung und Aufruf an der richtigen Stelle. Enthält etwa ein Element monat in einem XML-Dokument jeweils die Ziffer des betreffenden Monats ("10" statt des Strings "Oktober"), kann eine kleine Funktion die Ausgabe des Strings bewirken.

Beispiel
(define (getmonth mo li lang)
  (if (=  mo 1)
      (if (equal? lang "de")
          (car (car li))
	  (car (cdr li)))
      (getmonth (- mo 1) (cdr li) lang)))

(define monate (list (list "Januar" "January")
		(list "Februar" "February")
		(list "März" "March")
		(list "April" "April")
             	(list "Mai" "May")
		(list "Juni" "June") 
		(list "Juli" "July")
		(list "August" "August")
		(list "September" "September")
               	(list "Oktober" "October")
		(list "November" "November") 
		(list "Dezember" "December")))

; ----- Aufruf im Element mit:
(literal (getmonth (string->number (data (current-node))) monate "de"))

Die Funktion getmonth erledigt diese Aufgabe, indem sie fragt, ob der übergebene Monat "1" ist. Falls ja, fragt die Funktion nach der ebenfalls als Parameter übergebenen Sprache (hier "de") und gibt entweder den deutschen oder, in diesem Beispiel die letzte Zeile, den englischen Monatsnamen aus. Dazu ist eine Liste erforderlich, die die Begriffe enthält; hier ist es die Liste monate, die für jeden Monat wiederum eine Liste mit den Namen in verschiedenen (hier nur zwei) Sprachen vorhält.

Falls der Monat nicht der Januar ist (= mo 1), kommt ein für Lisp typisches Programmkonstrukt zum Einsatz: die Rekursion. getmonth ruft sich selbst wieder auf, allerdings mit der um alle Januar-Einträge verringerten (getmonth (- mo 1) (cdr li) lang) Liste und dem um 1 kleineren Parameter des Monats. Irgendwann (insgesamt sind maximal zwölf Durchläufe möglich) ist der Wert von mo 1 und aus der dann in der Gesamtliste vorn stehenden Liste kann der richtige Monat ausgegeben werden.

Was hier trivial erscheint, kann wichtig werden, wenn in einer größeren Anwendung vier oder fünf Sprachen gleichzeitig zu unterstützen sind. Denn solche Funktionen lassen sich unschwer erweitern.

Valid HTML 4.01!Valid CSS!