XMLidP2000

Sitemap

Sitemap

1 Einführung
1.1 Warum mehr weniger ist
1.2 Warum mehr mehr ist
1.3 Wohin die Reise geht
2 Was sind Dokumente?
2.1 Eine kurze Geschichte der Textverarbeitung
2.2 Bestandteile eines Dokumentes
2.3 Die neue, alte Idee: Strukturorientiert schreiben
2.4 Die Entwicklung des Hypertextes
2.5 Textformate im Web
2.6 Das SGML-Konzept: Generic Markup
2.7 Dokumente versus Daten
3 XML im Web
3.1 XML bei der Verwaltung von Websites
3.2 Clientseitige XML-Interpretation
3.2.1 XML mit CSS
3.2.2 XML mit XSL(T)
3.3 XML auf dem Server
3.4 Linking-Möglichkeiten von XML
3.5 XML als Datenaustauschformat
4 XML Quick Start
4.1 Dokumenttyp-Definition (DTD) und Instanzen
4.2 Verarbeitung der Dokumente
4.2.1 Beispiel: Verarbeitung mit Cost/TCL
4.2.2 Beispiel: Verarbeitung mit XSLT
4.2.3 Beispiel: XML/XSLT im Internet Explorer
4.2.4 Fazit
5 XML-DTDs: Die verständliche Beschreibung
5.1 Ein Wort zur Notation
5.2 Dokumente
5.3 Elemente
5.4 Zeichen, Namen und Zeichendaten
5.5 Kommentare
5.6 Processing Instructions
5.7 Wo bleibt Multimedia?
5.8 Dokumenttyp-Definition (DTD)
5.8.1 Elementtyp-Deklaration
5.8.2 Attributlisten-Deklaration
5.8.3 Möglichkeiten, die DTD zu gestalten und zu gliedern
5.8.4 Notation-Deklaration
6 Namensräume in XML
7 XPath: Adressierung von XML-Dokumentteilen
7.1 Zu Grunde liegendes Datenmodell
7.2 Zugriff auf den Datenbaum
7.3 Hilfe von Operatoren
7.4 Kernfunktionen für den Datenzugriff
8 XML: Linking
8.1 Notwendige Begriffe
8.2 XLink: einfache und erweiterte Links
8.2.1 Einfache Verweise
8.2.2 Erweiterte Links
8.2.3 XLink in der Praxis
8.3 XPointer: Verweise in Dokumente hinein
8.3.1 XPath-Erweiterungen in XPointer
9 Überblick über Stylesheet-Sprachen
9.1 Cascading Style Sheets
9.1.1 Wertzuweisungen
9.1.2 Formatierungsmodell
9.1.3 CSS und XML
9.1.4 Ein Beispiel: XML im Mozilla
9.2 Document Style Semantics and Specification Language
9.2.1 Flow Objects
9.2.2 Verarbeitungs-Modus
9.2.3 DSSSL praktisch
9.2.4 Langer Marsch von DSSSL nach HTML
9.3 Extensible Stylesheet Language (XSLT und XSL)
9.3.1 Verhältnis von XSLT zu XSL
9.3.2 Formatierung mit XSL
10 XSL-Transformationen
10.1 Grundsätzliches über Templates
10.2 Ergänzungen zum Datenmodell von XPath
10.3 Struktur von XSLT-Stylesheets
10.4 Den Ergebnisbaum erzeugen
10.4.1 Diverse Basiselemente
10.4.2 Formatierte Nummerierung
10.4.3 Schleifen und bedingte Verarbeitung
10.4.4 Sortieren
10.4.5 Variable und Parameter
10.4.6 Zusätzliche Funktionen
10.4.7 XSLT-Erweiterungen
10.4.8 message, output
11 XSLT in Web-Anwendungen
11.1 XSLT im Internet Explorer
11.2 Linklisten erzeugen
11.3 Details einer Literaturgeschichte
11.3.1 Sortierte Überblicksseiten
11.3.2 Kalender: einzelne Tage ausgeben
12 XML-Editoren
12.1 Übersicht
12.1.1 Emacs + PSGML (mit XML-Unterstützung)
12.1.2 XML Notepad
12.1.3 XML Spy
12.1.4 XMetal
12.1.5 Epic
12.1.6 MarkupKit (für MS Word)
12.1.7 WordPerfect Office2000
12.2 Emacs und PSGML (mit XML-Unterstützung)
12.3 XML-Notepad
12.4 XML Spy
12.5 XMetal
12.6 Epic
12.7 MarkupKit (für MS Word)
12.8 WordPerfect Office2000
12.9 Fazit
13 Entwicklung einer DTD
13.1 Auswahl einer Mehrzweck-DTD
13.2 Entwurf einer DTD
13.2.1 Dokumentanalyse
13.2.2 Tipps und Tricks
13.3 Instanzen ohne DTD
14 Herstellung dieses Buches
14.1 Zielsetzung und Randbedingungen
14.2 Definition der DTD
14.2.1 Schritt 1: Die Grobstruktur
14.2.2 Schritt 2: Elemente auf Zeichenebene
14.2.3 Schritt 3: Die Details
14.3 Formatieren des Manuskriptes
14.3.1 Konvertierung in HTML
14.3.2 Aufbereitung für den Ausdruck
14.4 Erfahrungen mit der zweiten Auflage
15 Anwendungsbeispiel Literatur
15.1 Vorüberlegungen
15.2 En détail: die Autoren in der DTD
15.3 Wie die Daten ins Web gelangen
15.3.1 Inhaltsverzeichnis generieren
15.3.2 Ausgabe der Autorendaten
15.4 Vollständige Listings
15.4.1 DTD für die Literaturgeschichte
15.4.2 DSSSL-Listing: Inhaltsverzeichnis
15.4.3 DSSSL-Listing: Ausgabe eines einzelnen Autors
15.4.4 Perl-Code für Ausgabe einzelner Autoren
16 Verteilte Softwareverwaltung mit XML
16.1 Aufgabenbeschreibung
16.2 XML als Datenbasis
16.3 Bilden von DTD-Hierarchien
16.4 Zusammentragen von verteilten XML-Fragmenten
16.5 Fazit
16.6 Stylesheet zur Transformation in HTML
17 E-Commerce mit XML
17.1 B2B-E-Commerce
17.1.1 Die Rolle von XML
17.1.2 Technische Aspekte
17.2 BMEcat
17.3 Electronic Business XML (ebXML)
17.3.1 Arbeitsgruppen
17.3.2 Zeitplan des Projekts
17.4 XML und EDIFACT
18 XML und Apache
18.1 XML-Transformation per CGI
18.1.1 Konfiguration des Servers
18.1.2 CGI-Skript: xmlhandler.cgi
18.1.3 Beispiel: von HTML nach HTML mit DSSSL oder XSLT
18.2 Cocoon
18.2.1 Extensible Server Pages (XSP)
18.2.2 Beispiel: Formatierung in PDF mit XSL
18.2.3 Beispiel: Simuliertes XLink mit Dynamic HTML/JavaScript
18.2.4 Installation
19 XHTML: Neues HTML 4 — erweiterbar
19.1 Status quo: HTML neu definiert
19.2 Modulare Zukunft
20 Transformation von XML in WML und HTML
20.1 Erzeugen der WML-Dateien
20.2 Erzeugen der HTML-Dateien
21 Ausblick
21.1 XML Schema
21.2 Programmierung mit XML-Daten
21.3 XML und Java
21.4 Resource Description Framework
21.5 Die Zukunft
A Extensible Markup Language (XML) 1.0
A.1 Einleitung
A.1.1 Herkunft und Ziele
A.1.2 Terminologie
A.2 Dokumente
A.2.1 Wohlgeformte XML-Dokumente
A.2.2 Zeichen
A.2.3 Allgemeine syntaktische Konstrukte
A.2.4 Zeichendaten und Markup
A.2.5 Kommentare
A.2.6 Processing Instructions
A.2.7 CDATA-Abschnitte
A.2.8 Prolog und Dokumenttyp-Deklaration
A.2.9 Standalone-Dokumentdeklaration
A.2.10 Behandlung von Leerraum
A.2.11 Behandlung des Zeilenendes
A.2.12 Identifikation der Sprache
A.3 Logische Strukturen
A.3.1 Start-Tags, End-Tags und Leeres-Element-Tags
A.3.2 Elementtyp-Deklarationen
A.3.3 Attributlisten-Deklaration
A.3.4 Bedingte Abschnitte
A.4 Physikalische Strukturen
A.4.1 Zeichen- und Entity-Referenzen
A.4.2 Entity-Deklarationen
A.4.3 Analysierte Entities
A.4.4 Behandlung von Entities und Referenzen durch einen XML-Prozessor
A.4.5 Konstruktion des Ersetzungstextes von internen Entities
A.4.6 Vordefinierte Entities
A.4.7 Notation-Deklarationen
A.4.8 Dokument-Entity
A.5 Konformität
A.5.1 Validierende und nicht-validierende Prozessoren
A.5.2 Benutzen von XML-Prozessoren
A.6 Notation
A.7 Anhang A: Referenzen
A.7.1 Normative Referenzen
A.7.2 Weitere Referenzen
A.8 Anhang B: Zeichenklassen
A.9 Anhang C: XML und SGML (nicht normativ)
A.10 Anhang D: Expansion von Entity- und Zeichenreferenzen (nicht normativ)
A.11 Anhang E: Deterministische Inhaltsmodelle (nicht normativ)
A.12 Anhang F: Automatische Erkennung von Zeichenkodierungen (nicht normativ)
A.13 Anhang G: XML-Arbeitsgruppe des W3C (nicht normativ)
B Verknüpfen von Style Sheets mit XML-Dokumenten Version 1.0
B.1 Die xml-stylesheet-Processing-Instruction
B.2 Anhang A: Referenzen
B.3 Anhang B: Begründung
C Verhältnis von XML zu SGML und HTML
C.1 XML und SGML
C.2 XML und HTML
D Übersichten
D.1 Cascading Style Sheets
D.1.1 CSS-Eigenschaften und -Werte
D.1.2 CSS-Muster
D.2 DSSSL: Flow Objects
D.3 Syntax der XSLT-Elemente
D.4 DTD-Fragment für XSLT-Stylesheets (nicht normativ)
D.5 Relevante Spezifikationen und Organisationen
D.5.1 International Organization for Standardization
D.5.2 World Wide Web Consortium
D.5.3 Organization for the Advancement of Structured Information Standards
D.5.4 Internet Society und Internet Engineering Task Force
D.5.5 ISO-639-Sprachcodes
D.5.6 ISO-3166-Ländercodes
D.5.7 Zeichensatz ISO-Latin-1
D.5.8 Sonderzeichen
D.6 XML-1.0-Regeln

15 Anwendungsbeispiel Literatur

Arbeit, Arbeit —, ich bitte, gleich wird er mich einen Feind der Menschheit schelten, einen inimicus humanae naturae, wenn ich es wage, an Zeiten zu erinnern, wo er mit dieser Fanfare den gewohnten Effekt durchaus nicht erzielt hätte, nämlich an Zeiten, wo das Gegenteil seines Ideals in unvergleichlich höheren Ehren standFussnoteDas Zitat stammt aus dem Zauberberg. Sprecher ist Naphta in einem der Gespräche mit Settembrini..

Thomas Mann

Selten hat etwas so deutlich gezeigt, dass Informatiker gern spielen, wie das World Wide WebFussnoteDass das nicht nur für Informatiker gilt, ist ein unbestätigtes Gerücht. Gemeint ist damit, dass spielerische Web-Seiten und viele bunte Bilder allerorten anzutreffen sind. Gemeint ist aber auch, dass kostenlos erhältliche Software im Web zeigt, dass der scheinbar ziellose Spieltrieb oft genug Nützliches bringt.. Was das Spiel für Implikationen hat, wird sich erst in ein paar Jahren zeigen, wenn jemand untersucht, was sich an Informationen in Web-Dokumenten angesammelt hat — und wofür das gut ist oder sein kann. Hier sei ein Miniaturbeispiel dessen gegeben, was — natürlich mit den Mitteln der Extensible Markup Language — ohne großen Aufwand möglich ist, wenn es darum geht, strukturierte Daten in Form von HTML im Web zur Verfügung zu stellen. Ein kleines und nachvollziehbares Anwendungsbeispiel inklusive Konvertierung von XML nach HTML soll die Möglichkeiten, die in XML stecken, demonstrieren — als Datenformat und als Basis für die Aufbereitung für das Web. In diesem Fall soll das XML-Dokument tatsächlich eine Datei sein, die Angaben über Autoren der Weltliteratur enthält — ohne dass die Angaben erst aus einer Datenbank generiert werden. Das Ziel ist es, neben einem Inhaltsverzeichnis sehen zu können, welche Autoren in einem bestimmten Jahrhundert gelebt haben, wie ihre Werke heißen, wer an einem konkreten Tag Geburtstag hat respektive gestorben ist (Kalender) und möglicherweise mehr. Hier kann natürlich nicht alles dargestellt werden.

Hinweis

Im Vergleich zum Buch selbst als XML-Anwendung, wie es das vorige Kapitel thematisiert hat, handelt es sich hier um eine andere Art der Gliederung. Nicht erst das gesamte Dokument bildet ein Ganzes, sondern es umfasst bereits eine Vielzahl kleiner, in sich abgeschlossener Einheiten, eben die Autoren. Zwar sind auch Kapitel für sich lesbar, aber sie sind nicht so unabhängig von der Struktur eines Buches wie Autoreneinträge im Vergleich zur gesamten Literaturgeschichte.

Daten: in einer Datei oder einem DBMS?

Der Grund dafür, die Daten in einer einzigen Datei zu halten, war einzig und allein BequemlichkeitFussnoteNicht ganz, es lag zum Teil auch daran: Unter XML-Anhängern geistert der Traum eines universellen Datenformats (nicht proprietär) umher, das weltweiten Informationsaustausch zwischen unterschiedlichen Anwendungen möglich macht. Ein Beispiel: Im kommerziellen Bereich existiert eine XML-EDI-Arbeitsgruppe, die sich um den Austausch von Geschäftsdaten auf XML-Ebene bemüht. Solche Daten können selbstverständlich aus Datenbanken kommen; sie werden es im Normalfall auch tun.. Derselbe Grund könnte eines Tages für eine Datenbank sprechen. An die Arbeit mit dem Emacs gewöhnt, fällt es leicht, das Editieren per Hand und mit Hilfe des Emacs-Modes (PSGML) vorzunehmen. So lassen sich DTD, XML und Style Sheet quasi gleichzeitig bearbeiten und überprüfenFussnoteUm den Glaubenskrieg um den einzig wahren xyz-Editor gleich wieder zu beenden: Der eigentliche Grund ist das Vorhandensein des Emacs auf den Rechnern der Autoren und der relative Komfort des PSGML-Mode. Er erlaubt es, sich an beliebiger Stelle im Dokument die möglichen Elemente zeigen zu lassen, Elementnamen zu verändern etc... Dass es eine Reihe weiterer für SGML geeigneter Editoren gibt, wollen wir nicht verschweigen. Sie finden sie auf Robin Covers Webseite unter dem Stichwort Software.

Für wen eine solche Anwendung überhaupt sinnvoll ist, sei hier gar nicht erst diskutiertFussnoteDoch: Zwischen Ernst und Spielerei angesiedelt zeigt sie, wenn sie weiter mit Inhalt gefüllt wird, einen Teil der Literaturgeschichte, in dem sich blättern lässt.. Sie ist klein genug, um im Rahmen dieses Buches halbwegs umfassend dargestellt zu werden, und sie kann wachsen, so dass sie später eine mittelgroße Anwendung sein könnte. Unter http://www.mintert.com/xml/ ist der aktuelle URL dieser kleinen Literaturgeschichte zu finden.

Was die Anwendung leisten soll

Im Wesentlichen gibt es bei einer solch kleinen Anwendung vier Phasen beziehungsweise bedenkenswerte Aspekte:

  1. Was soll sie leisten (Funktionen)?
  2. Welche Daten soll sie enthalten (DTD)?
  3. Wie sind die Daten zu organisieren (DTD)?
  4. Welche Sichten sind gewünscht (DSSSL)?

Im Grunde ist die erste der Fragen bereits beantwortet worden: Einzelne Autoren, Jahrhunderte etc. sollten sich anzeigen lassen. Die zweite Frage ist insofern wesentlich komplizierter, als die Daten so gehalten sein müssen, dass die Struktur (das betrifft implizit auch die dritte Frage) erweiterbar ist. So sahen etwa die ersten Versionen von XML-Daten und DTD die Einbeziehung des Nobelpreises nicht vor. Auch ein Bild war zunächst nicht enthalten. Aber eins nach dem anderen.

Herunter 15.1 Vorüberlegungen
Herunter 15.2 En détail: die Autoren in der DTD
Herunter 15.3 Wie die Daten ins Web gelangen
Herunter 15.4 Vollständige Listings

Valid HTML 4.01!Valid CSS!