XMLidP2000

Sitemap

Sitemap

1 Einführung
1.1 Warum mehr weniger ist
1.2 Warum mehr mehr ist
1.3 Wohin die Reise geht
2 Was sind Dokumente?
2.1 Eine kurze Geschichte der Textverarbeitung
2.2 Bestandteile eines Dokumentes
2.3 Die neue, alte Idee: Strukturorientiert schreiben
2.4 Die Entwicklung des Hypertextes
2.5 Textformate im Web
2.6 Das SGML-Konzept: Generic Markup
2.7 Dokumente versus Daten
3 XML im Web
3.1 XML bei der Verwaltung von Websites
3.2 Clientseitige XML-Interpretation
3.2.1 XML mit CSS
3.2.2 XML mit XSL(T)
3.3 XML auf dem Server
3.4 Linking-Möglichkeiten von XML
3.5 XML als Datenaustauschformat
4 XML Quick Start
4.1 Dokumenttyp-Definition (DTD) und Instanzen
4.2 Verarbeitung der Dokumente
4.2.1 Beispiel: Verarbeitung mit Cost/TCL
4.2.2 Beispiel: Verarbeitung mit XSLT
4.2.3 Beispiel: XML/XSLT im Internet Explorer
4.2.4 Fazit
5 XML-DTDs: Die verständliche Beschreibung
5.1 Ein Wort zur Notation
5.2 Dokumente
5.3 Elemente
5.4 Zeichen, Namen und Zeichendaten
5.5 Kommentare
5.6 Processing Instructions
5.7 Wo bleibt Multimedia?
5.8 Dokumenttyp-Definition (DTD)
5.8.1 Elementtyp-Deklaration
5.8.2 Attributlisten-Deklaration
5.8.3 Möglichkeiten, die DTD zu gestalten und zu gliedern
5.8.4 Notation-Deklaration
6 Namensräume in XML
7 XPath: Adressierung von XML-Dokumentteilen
7.1 Zu Grunde liegendes Datenmodell
7.2 Zugriff auf den Datenbaum
7.3 Hilfe von Operatoren
7.4 Kernfunktionen für den Datenzugriff
8 XML: Linking
8.1 Notwendige Begriffe
8.2 XLink: einfache und erweiterte Links
8.2.1 Einfache Verweise
8.2.2 Erweiterte Links
8.2.3 XLink in der Praxis
8.3 XPointer: Verweise in Dokumente hinein
8.3.1 XPath-Erweiterungen in XPointer
9 Überblick über Stylesheet-Sprachen
9.1 Cascading Style Sheets
9.1.1 Wertzuweisungen
9.1.2 Formatierungsmodell
9.1.3 CSS und XML
9.1.4 Ein Beispiel: XML im Mozilla
9.2 Document Style Semantics and Specification Language
9.2.1 Flow Objects
9.2.2 Verarbeitungs-Modus
9.2.3 DSSSL praktisch
9.2.4 Langer Marsch von DSSSL nach HTML
9.3 Extensible Stylesheet Language (XSLT und XSL)
9.3.1 Verhältnis von XSLT zu XSL
9.3.2 Formatierung mit XSL
10 XSL-Transformationen
10.1 Grundsätzliches über Templates
10.2 Ergänzungen zum Datenmodell von XPath
10.3 Struktur von XSLT-Stylesheets
10.4 Den Ergebnisbaum erzeugen
10.4.1 Diverse Basiselemente
10.4.2 Formatierte Nummerierung
10.4.3 Schleifen und bedingte Verarbeitung
10.4.4 Sortieren
10.4.5 Variable und Parameter
10.4.6 Zusätzliche Funktionen
10.4.7 XSLT-Erweiterungen
10.4.8 message, output
11 XSLT in Web-Anwendungen
11.1 XSLT im Internet Explorer
11.2 Linklisten erzeugen
11.3 Details einer Literaturgeschichte
11.3.1 Sortierte Überblicksseiten
11.3.2 Kalender: einzelne Tage ausgeben
12 XML-Editoren
12.1 Übersicht
12.1.1 Emacs + PSGML (mit XML-Unterstützung)
12.1.2 XML Notepad
12.1.3 XML Spy
12.1.4 XMetal
12.1.5 Epic
12.1.6 MarkupKit (für MS Word)
12.1.7 WordPerfect Office2000
12.2 Emacs und PSGML (mit XML-Unterstützung)
12.3 XML-Notepad
12.4 XML Spy
12.5 XMetal
12.6 Epic
12.7 MarkupKit (für MS Word)
12.8 WordPerfect Office2000
12.9 Fazit
13 Entwicklung einer DTD
13.1 Auswahl einer Mehrzweck-DTD
13.2 Entwurf einer DTD
13.2.1 Dokumentanalyse
13.2.2 Tipps und Tricks
13.3 Instanzen ohne DTD
14 Herstellung dieses Buches
14.1 Zielsetzung und Randbedingungen
14.2 Definition der DTD
14.2.1 Schritt 1: Die Grobstruktur
14.2.2 Schritt 2: Elemente auf Zeichenebene
14.2.3 Schritt 3: Die Details
14.3 Formatieren des Manuskriptes
14.3.1 Konvertierung in HTML
14.3.2 Aufbereitung für den Ausdruck
14.4 Erfahrungen mit der zweiten Auflage
15 Anwendungsbeispiel Literatur
15.1 Vorüberlegungen
15.2 En détail: die Autoren in der DTD
15.3 Wie die Daten ins Web gelangen
15.3.1 Inhaltsverzeichnis generieren
15.3.2 Ausgabe der Autorendaten
15.4 Vollständige Listings
15.4.1 DTD für die Literaturgeschichte
15.4.2 DSSSL-Listing: Inhaltsverzeichnis
15.4.3 DSSSL-Listing: Ausgabe eines einzelnen Autors
15.4.4 Perl-Code für Ausgabe einzelner Autoren
16 Verteilte Softwareverwaltung mit XML
16.1 Aufgabenbeschreibung
16.2 XML als Datenbasis
16.3 Bilden von DTD-Hierarchien
16.4 Zusammentragen von verteilten XML-Fragmenten
16.5 Fazit
16.6 Stylesheet zur Transformation in HTML
17 E-Commerce mit XML
17.1 B2B-E-Commerce
17.1.1 Die Rolle von XML
17.1.2 Technische Aspekte
17.2 BMEcat
17.3 Electronic Business XML (ebXML)
17.3.1 Arbeitsgruppen
17.3.2 Zeitplan des Projekts
17.4 XML und EDIFACT
18 XML und Apache
18.1 XML-Transformation per CGI
18.1.1 Konfiguration des Servers
18.1.2 CGI-Skript: xmlhandler.cgi
18.1.3 Beispiel: von HTML nach HTML mit DSSSL oder XSLT
18.2 Cocoon
18.2.1 Extensible Server Pages (XSP)
18.2.2 Beispiel: Formatierung in PDF mit XSL
18.2.3 Beispiel: Simuliertes XLink mit Dynamic HTML/JavaScript
18.2.4 Installation
19 XHTML: Neues HTML 4 — erweiterbar
19.1 Status quo: HTML neu definiert
19.2 Modulare Zukunft
20 Transformation von XML in WML und HTML
20.1 Erzeugen der WML-Dateien
20.2 Erzeugen der HTML-Dateien
21 Ausblick
21.1 XML Schema
21.2 Programmierung mit XML-Daten
21.3 XML und Java
21.4 Resource Description Framework
21.5 Die Zukunft
A Extensible Markup Language (XML) 1.0
A.1 Einleitung
A.1.1 Herkunft und Ziele
A.1.2 Terminologie
A.2 Dokumente
A.2.1 Wohlgeformte XML-Dokumente
A.2.2 Zeichen
A.2.3 Allgemeine syntaktische Konstrukte
A.2.4 Zeichendaten und Markup
A.2.5 Kommentare
A.2.6 Processing Instructions
A.2.7 CDATA-Abschnitte
A.2.8 Prolog und Dokumenttyp-Deklaration
A.2.9 Standalone-Dokumentdeklaration
A.2.10 Behandlung von Leerraum
A.2.11 Behandlung des Zeilenendes
A.2.12 Identifikation der Sprache
A.3 Logische Strukturen
A.3.1 Start-Tags, End-Tags und Leeres-Element-Tags
A.3.2 Elementtyp-Deklarationen
A.3.3 Attributlisten-Deklaration
A.3.4 Bedingte Abschnitte
A.4 Physikalische Strukturen
A.4.1 Zeichen- und Entity-Referenzen
A.4.2 Entity-Deklarationen
A.4.3 Analysierte Entities
A.4.4 Behandlung von Entities und Referenzen durch einen XML-Prozessor
A.4.5 Konstruktion des Ersetzungstextes von internen Entities
A.4.6 Vordefinierte Entities
A.4.7 Notation-Deklarationen
A.4.8 Dokument-Entity
A.5 Konformität
A.5.1 Validierende und nicht-validierende Prozessoren
A.5.2 Benutzen von XML-Prozessoren
A.6 Notation
A.7 Anhang A: Referenzen
A.7.1 Normative Referenzen
A.7.2 Weitere Referenzen
A.8 Anhang B: Zeichenklassen
A.9 Anhang C: XML und SGML (nicht normativ)
A.10 Anhang D: Expansion von Entity- und Zeichenreferenzen (nicht normativ)
A.11 Anhang E: Deterministische Inhaltsmodelle (nicht normativ)
A.12 Anhang F: Automatische Erkennung von Zeichenkodierungen (nicht normativ)
A.13 Anhang G: XML-Arbeitsgruppe des W3C (nicht normativ)
B Verknüpfen von Style Sheets mit XML-Dokumenten Version 1.0
B.1 Die xml-stylesheet-Processing-Instruction
B.2 Anhang A: Referenzen
B.3 Anhang B: Begründung
C Verhältnis von XML zu SGML und HTML
C.1 XML und SGML
C.2 XML und HTML
D Übersichten
D.1 Cascading Style Sheets
D.1.1 CSS-Eigenschaften und -Werte
D.1.2 CSS-Muster
D.2 DSSSL: Flow Objects
D.3 Syntax der XSLT-Elemente
D.4 DTD-Fragment für XSLT-Stylesheets (nicht normativ)
D.5 Relevante Spezifikationen und Organisationen
D.5.1 International Organization for Standardization
D.5.2 World Wide Web Consortium
D.5.3 Organization for the Advancement of Structured Information Standards
D.5.4 Internet Society und Internet Engineering Task Force
D.5.5 ISO-639-Sprachcodes
D.5.6 ISO-3166-Ländercodes
D.5.7 Zeichensatz ISO-Latin-1
D.5.8 Sonderzeichen
D.6 XML-1.0-Regeln

15.1 Vorüberlegungen

Zunächst war zu überlegen, welche Daten sinnvollerweise in den Quellen enthalten sein könnten und sollten. Ein erstes Brain-Storming brachte folgendes Ergebnis (unsortiert):

Ausgangspunkt URL-Sammlung

Am wichtigsten war ursprünglich der URL, denn schließlich sollte es sich um eine Online-Anwendung handeln, das heißt, die erste Auswahl enthielt hauptsächlich solche Autoren, zu denen ein sinnvoller URL zu finden warFussnotePersönliche Neigungen spielten selbstverständlich keine Rolle.. Aber schnell stellte sich heraus, dass sich schon mit diesen wenigen Daten einiges würde machen lassen; vor allem dann, wenn man die Daten um ein paar Details ergänzte (Nobelpreis, Begebenheiten, Geschlecht et cetera).

Was die Darstellung auf dem Bildschirm angeht, kommt auch in diesem Fall James Clark Jade zum Einsatz — aus ähnlichen Gründen wie in Kapitel 14. Unabhängig davon, ob bereits Browser existieren, die XML verstehen, bietet es sich an, eine solche Autorensammlung in verschiedene Sichten aufzuteilen und diese Sichten als HTML-Dateien zu speichern beziehungsweise auf Mausklick zu generieren.

Unterschiedliche Sichten, verschiedene Style Sheets

Hintergrund dieser Entscheidung ist, dass der Ausgangspunkt der Anwendung ein Web-Dokument sein soll, das neben einem Willkommenstext ein Formular enthält, über das sich Autoren, Jahrhunderte etc. auswählen lassen. Für die Ausgabe in einen Browser bedeutet das unterschiedlichen Inhalt, für das Generieren der Sichten unterschiedliche Style Sheets in DSSSL, mit deren Hilfe Jade die gewünschte HTML-Datei erzeugt. Vor allem bei größeren Dokumenten stellt sich die Frage, ob sie in ihrer Gesamtheit oder nur das Ergebnis einer Anfrage übertragen werden soll — etwa ein einzelner Autor, dessen Daten nur 2 bis 10 KByte umfassen, während die Gesamtheit der Daten bei 100 Autoren schon 200 KByte bis hin zu einem Megabyte betragen kann (abhängig von der Menge an vorhandenen Details).

Vor allem die Tatsache, dass die einzelnen Sichten immer nur einen Bruchteil der gesamten Informationen enthalten sollten, sprach gegen eine Übertragung aller Datensätze (hier: einzelne Autoren).

Makefile als Hilfsinstrument
Hinweis

Je mehr solcher Sichten man aus einem Dokument generieren will, desto wichtiger wird das Tool zum Tool. Ausgehend von einem Unix-System ist es einfach, sich ein Makefile zu erstellen, das über Jade die jeweiligen HTML-Dateien erzeugt.

# Makefile zum Generieren der HTML-Dateien 
SRC = <SGML/XML-Quelle>
all: toc century male female <...>

toc:
	jade -d $@.dsl -t sgml xml.decl ${SRC}.xml > $@.html

century:
	jade -d $@.dsl -t sgml xml.decl ${SRC}.xml > $@.html

# weitere Zeilen ähnlicher Art
          

Beim Aufruf von make toc benutzt Jade das DSSSL-Programm toc.dsl und wendet es unter SGML-Kriterien (und unter Einbeziehung der XML-Deklaration) auf die Quelldatei an. In toc.html schließlich steht das Ergebnis nach erfolgreichem Programmlauf.

Analoge Hilfsmittel dürften sich auch auf anderen Betriebssystemen finden. Unter MSDOS reicht notfalls eine Batch-Datei, die abhängig von übergebenen Parametern Jade anstößt.

Erste Aufgabe: DTD

Aber bis zum Style Sheet ist es noch ein Stück Weges, denn zunächst muss eine Dokumenttyp-Definition existieren, deren Vorgaben wiederum die XML-Quelle folgen muss. Im ersten Entwurf war die dazugehörige DTD schnell fertigFussnoteSoweit man bei solchen Projekten das Wort fertig jemals berechtigterweise verwenden kann. Und schnell heißt hier quick & dirty. — und wurde innerhalb weniger Tage zehnmal revidiert. Eine der ersten Versionen sah folgende Einteilung vor:

<!ELEMENT lithist ( author+ ) >
<!ELEMENT author ( name , vita , work* , event* , comment* ) >
      
Vorüberlegungen zur Struktur

Bei den Überlegungen, was Bestandteil dieser Pseudoliteraturgeschichte sein sollte, waren die Autoren, wie gesagt, zentralFussnoteDeshalb fehlt hier jegliches weitere Element.. Zusätzlich könnte man hier Überschriften und eine Einführung vorsehen, aber beides lässt sich auch über ein Style Sheet in das HTML-Dokument transportieren. Das Plus-Zeichen heißt, dass mindestens ein Autor vorhanden sein muss, aber schließlich ist das der Sinn der Sache. In der zweiten Zeile ist festgelegt, woraus ein Autoreneintrag bestehen soll. Es handelt sich um eine Sequenz von zwingend vorhandenen und optionalen Elementen. Zwingend sind nur der Name und die Lebensdaten, alle anderen Angaben sind optional: Sie können fehlen oder einmal oder mehrfach vorkommen. Bei Werken und Begebenheiten leuchtet das ein, beim Kommentar vielleicht nicht. Mehrmaliges Vorkommen ist hier dazu gedacht, Angaben in mehreren Sprachen zur Verfügung zu stellen (siehe unten).

Hinweis

An der Kleinigkeit — sollen Überschriften und Einführung in die DTD oder nicht? — ist zu sehen, dass eine DTD mehr Zeitaufwand bedeutet, als ihre leichte Lesbarkeit suggeriert. Vor allem wird sich zeigen, dass man immer wieder überlegt, inwieweit dies oder jenes geändert oder hinzugefügt werden sollte.

Valid HTML 4.01!Valid CSS!