XMLidP2000

Sitemap

Sitemap

1 Einführung
1.1 Warum mehr weniger ist
1.2 Warum mehr mehr ist
1.3 Wohin die Reise geht
2 Was sind Dokumente?
2.1 Eine kurze Geschichte der Textverarbeitung
2.2 Bestandteile eines Dokumentes
2.3 Die neue, alte Idee: Strukturorientiert schreiben
2.4 Die Entwicklung des Hypertextes
2.5 Textformate im Web
2.6 Das SGML-Konzept: Generic Markup
2.7 Dokumente versus Daten
3 XML im Web
3.1 XML bei der Verwaltung von Websites
3.2 Clientseitige XML-Interpretation
3.2.1 XML mit CSS
3.2.2 XML mit XSL(T)
3.3 XML auf dem Server
3.4 Linking-Möglichkeiten von XML
3.5 XML als Datenaustauschformat
4 XML Quick Start
4.1 Dokumenttyp-Definition (DTD) und Instanzen
4.2 Verarbeitung der Dokumente
4.2.1 Beispiel: Verarbeitung mit Cost/TCL
4.2.2 Beispiel: Verarbeitung mit XSLT
4.2.3 Beispiel: XML/XSLT im Internet Explorer
4.2.4 Fazit
5 XML-DTDs: Die verständliche Beschreibung
5.1 Ein Wort zur Notation
5.2 Dokumente
5.3 Elemente
5.4 Zeichen, Namen und Zeichendaten
5.5 Kommentare
5.6 Processing Instructions
5.7 Wo bleibt Multimedia?
5.8 Dokumenttyp-Definition (DTD)
5.8.1 Elementtyp-Deklaration
5.8.2 Attributlisten-Deklaration
5.8.3 Möglichkeiten, die DTD zu gestalten und zu gliedern
5.8.4 Notation-Deklaration
6 Namensräume in XML
7 XPath: Adressierung von XML-Dokumentteilen
7.1 Zu Grunde liegendes Datenmodell
7.2 Zugriff auf den Datenbaum
7.3 Hilfe von Operatoren
7.4 Kernfunktionen für den Datenzugriff
8 XML: Linking
8.1 Notwendige Begriffe
8.2 XLink: einfache und erweiterte Links
8.2.1 Einfache Verweise
8.2.2 Erweiterte Links
8.2.3 XLink in der Praxis
8.3 XPointer: Verweise in Dokumente hinein
8.3.1 XPath-Erweiterungen in XPointer
9 Überblick über Stylesheet-Sprachen
9.1 Cascading Style Sheets
9.1.1 Wertzuweisungen
9.1.2 Formatierungsmodell
9.1.3 CSS und XML
9.1.4 Ein Beispiel: XML im Mozilla
9.2 Document Style Semantics and Specification Language
9.2.1 Flow Objects
9.2.2 Verarbeitungs-Modus
9.2.3 DSSSL praktisch
9.2.4 Langer Marsch von DSSSL nach HTML
9.3 Extensible Stylesheet Language (XSLT und XSL)
9.3.1 Verhältnis von XSLT zu XSL
9.3.2 Formatierung mit XSL
10 XSL-Transformationen
10.1 Grundsätzliches über Templates
10.2 Ergänzungen zum Datenmodell von XPath
10.3 Struktur von XSLT-Stylesheets
10.4 Den Ergebnisbaum erzeugen
10.4.1 Diverse Basiselemente
10.4.2 Formatierte Nummerierung
10.4.3 Schleifen und bedingte Verarbeitung
10.4.4 Sortieren
10.4.5 Variable und Parameter
10.4.6 Zusätzliche Funktionen
10.4.7 XSLT-Erweiterungen
10.4.8 message, output
11 XSLT in Web-Anwendungen
11.1 XSLT im Internet Explorer
11.2 Linklisten erzeugen
11.3 Details einer Literaturgeschichte
11.3.1 Sortierte Überblicksseiten
11.3.2 Kalender: einzelne Tage ausgeben
12 XML-Editoren
12.1 Übersicht
12.1.1 Emacs + PSGML (mit XML-Unterstützung)
12.1.2 XML Notepad
12.1.3 XML Spy
12.1.4 XMetal
12.1.5 Epic
12.1.6 MarkupKit (für MS Word)
12.1.7 WordPerfect Office2000
12.2 Emacs und PSGML (mit XML-Unterstützung)
12.3 XML-Notepad
12.4 XML Spy
12.5 XMetal
12.6 Epic
12.7 MarkupKit (für MS Word)
12.8 WordPerfect Office2000
12.9 Fazit
13 Entwicklung einer DTD
13.1 Auswahl einer Mehrzweck-DTD
13.2 Entwurf einer DTD
13.2.1 Dokumentanalyse
13.2.2 Tipps und Tricks
13.3 Instanzen ohne DTD
14 Herstellung dieses Buches
14.1 Zielsetzung und Randbedingungen
14.2 Definition der DTD
14.2.1 Schritt 1: Die Grobstruktur
14.2.2 Schritt 2: Elemente auf Zeichenebene
14.2.3 Schritt 3: Die Details
14.3 Formatieren des Manuskriptes
14.3.1 Konvertierung in HTML
14.3.2 Aufbereitung für den Ausdruck
14.4 Erfahrungen mit der zweiten Auflage
15 Anwendungsbeispiel Literatur
15.1 Vorüberlegungen
15.2 En détail: die Autoren in der DTD
15.3 Wie die Daten ins Web gelangen
15.3.1 Inhaltsverzeichnis generieren
15.3.2 Ausgabe der Autorendaten
15.4 Vollständige Listings
15.4.1 DTD für die Literaturgeschichte
15.4.2 DSSSL-Listing: Inhaltsverzeichnis
15.4.3 DSSSL-Listing: Ausgabe eines einzelnen Autors
15.4.4 Perl-Code für Ausgabe einzelner Autoren
16 Verteilte Softwareverwaltung mit XML
16.1 Aufgabenbeschreibung
16.2 XML als Datenbasis
16.3 Bilden von DTD-Hierarchien
16.4 Zusammentragen von verteilten XML-Fragmenten
16.5 Fazit
16.6 Stylesheet zur Transformation in HTML
17 E-Commerce mit XML
17.1 B2B-E-Commerce
17.1.1 Die Rolle von XML
17.1.2 Technische Aspekte
17.2 BMEcat
17.3 Electronic Business XML (ebXML)
17.3.1 Arbeitsgruppen
17.3.2 Zeitplan des Projekts
17.4 XML und EDIFACT
18 XML und Apache
18.1 XML-Transformation per CGI
18.1.1 Konfiguration des Servers
18.1.2 CGI-Skript: xmlhandler.cgi
18.1.3 Beispiel: von HTML nach HTML mit DSSSL oder XSLT
18.2 Cocoon
18.2.1 Extensible Server Pages (XSP)
18.2.2 Beispiel: Formatierung in PDF mit XSL
18.2.3 Beispiel: Simuliertes XLink mit Dynamic HTML/JavaScript
18.2.4 Installation
19 XHTML: Neues HTML 4 — erweiterbar
19.1 Status quo: HTML neu definiert
19.2 Modulare Zukunft
20 Transformation von XML in WML und HTML
20.1 Erzeugen der WML-Dateien
20.2 Erzeugen der HTML-Dateien
21 Ausblick
21.1 XML Schema
21.2 Programmierung mit XML-Daten
21.3 XML und Java
21.4 Resource Description Framework
21.5 Die Zukunft
A Extensible Markup Language (XML) 1.0
A.1 Einleitung
A.1.1 Herkunft und Ziele
A.1.2 Terminologie
A.2 Dokumente
A.2.1 Wohlgeformte XML-Dokumente
A.2.2 Zeichen
A.2.3 Allgemeine syntaktische Konstrukte
A.2.4 Zeichendaten und Markup
A.2.5 Kommentare
A.2.6 Processing Instructions
A.2.7 CDATA-Abschnitte
A.2.8 Prolog und Dokumenttyp-Deklaration
A.2.9 Standalone-Dokumentdeklaration
A.2.10 Behandlung von Leerraum
A.2.11 Behandlung des Zeilenendes
A.2.12 Identifikation der Sprache
A.3 Logische Strukturen
A.3.1 Start-Tags, End-Tags und Leeres-Element-Tags
A.3.2 Elementtyp-Deklarationen
A.3.3 Attributlisten-Deklaration
A.3.4 Bedingte Abschnitte
A.4 Physikalische Strukturen
A.4.1 Zeichen- und Entity-Referenzen
A.4.2 Entity-Deklarationen
A.4.3 Analysierte Entities
A.4.4 Behandlung von Entities und Referenzen durch einen XML-Prozessor
A.4.5 Konstruktion des Ersetzungstextes von internen Entities
A.4.6 Vordefinierte Entities
A.4.7 Notation-Deklarationen
A.4.8 Dokument-Entity
A.5 Konformität
A.5.1 Validierende und nicht-validierende Prozessoren
A.5.2 Benutzen von XML-Prozessoren
A.6 Notation
A.7 Anhang A: Referenzen
A.7.1 Normative Referenzen
A.7.2 Weitere Referenzen
A.8 Anhang B: Zeichenklassen
A.9 Anhang C: XML und SGML (nicht normativ)
A.10 Anhang D: Expansion von Entity- und Zeichenreferenzen (nicht normativ)
A.11 Anhang E: Deterministische Inhaltsmodelle (nicht normativ)
A.12 Anhang F: Automatische Erkennung von Zeichenkodierungen (nicht normativ)
A.13 Anhang G: XML-Arbeitsgruppe des W3C (nicht normativ)
B Verknüpfen von Style Sheets mit XML-Dokumenten Version 1.0
B.1 Die xml-stylesheet-Processing-Instruction
B.2 Anhang A: Referenzen
B.3 Anhang B: Begründung
C Verhältnis von XML zu SGML und HTML
C.1 XML und SGML
C.2 XML und HTML
D Übersichten
D.1 Cascading Style Sheets
D.1.1 CSS-Eigenschaften und -Werte
D.1.2 CSS-Muster
D.2 DSSSL: Flow Objects
D.3 Syntax der XSLT-Elemente
D.4 DTD-Fragment für XSLT-Stylesheets (nicht normativ)
D.5 Relevante Spezifikationen und Organisationen
D.5.1 International Organization for Standardization
D.5.2 World Wide Web Consortium
D.5.3 Organization for the Advancement of Structured Information Standards
D.5.4 Internet Society und Internet Engineering Task Force
D.5.5 ISO-639-Sprachcodes
D.5.6 ISO-3166-Ländercodes
D.5.7 Zeichensatz ISO-Latin-1
D.5.8 Sonderzeichen
D.6 XML-1.0-Regeln

13.2.1 Dokumentanalyse

Der erste Schritt auf dem Weg zur eigenen DTD besteht in der genauen Analyse der zu beschreibenden Dokumentklasse. Welche Vorgehensweise Sie hierbei wählen sollten, hängt stark von dem speziellen Einsatzgebiet ab. Sprechen Sie mit allen beteiligten Personen. Dazu gehören in jedem Fall die Endbenutzer (also die Autoren). Den Benutzern fällt es oft leichter, Mängel in einer DTD festzustellen, als den Dokumenttyp konstruktiv zu beschreiben. Es ist also hilfreich, den Anwendern einen ersten Entwurf der DTD zum Experimentieren zu geben. Sollen die XML-Instanzen später in eine Datenbank integriert werden? Dann ziehen Sie auch Ihren Datenbankfachmann zu Rate. Sprechen Sie mit Ihrem Setzer oder dem Programmierer, der vielleicht einen Konverter schreiben soll. Jede einzelne der beteiligten Personen kann eine andere Sichtweise haben, die es zu berücksichtigen gilt.

Neben diesen allgemeinen Hinweisen versuchen wir, durch die folgende Diskussion eine Art Anleitung zu geben. Als Einstieg soll die Frage dienen, was eine DTD und der Entwurf einer solchen eigentlich ist. Nach den vorangegangenen Kapiteln wissen Sie natürlich schon, wozu eine DTD dient. Sie beschreibt eine Klasse von gleichartigen Dokumenten. Demnach besteht der erste Ansatz beim DTD-Entwurf darin, eine Beschreibung zu finden. Dies ist sicherlich auch eine gute Vorgehensweise, aber wir wollen Ihnen einmal einen alternativen Blickwinkel vorstellen.

Dazu nehmen wir an, dass es in der Menge aller möglichen DTDs die eine gibt, die genau auf Ihre Bedürfnisse zugeschnitten ist. Die Aufgabe lautet dann nicht mehr, eine Klasse von Dokumenten zu beschreiben, um eine DTD zu entwerfen; jetzt geht es darum, jene eine optimale DTD zu finden. Nun wollen wir Ihnen nicht vorschlagen, alle möglichen DTDs herzunehmen und wie nach der Nadel im Heuhaufen Ihre zu suchen. Es geht nur um den Gedankengang.

Wo soll man mit der Suche beginnen und wie soll man vorgehen? — Es ist immer hilfreich, ein konkretes Dokument, vielleicht auch in Form einer wohlgeformten XML-Instanz, als Ausgangspunkt zu betrachten. Dazu eine DTD zu finden ist leicht: Man nimmt einfach die Elemente in genau der Verschachtelung, wie sie in der Instanz stehen, als Dokumenttyp-Definition. Das folgende Beispiel veranschaulicht das:

Beispiel
<?xml version="1.0"?>
<buch>
  <kapitel>
     <ueberschrift>Einleitung</ueberschrift>
     <absatz>...</absatz>
  </kapitel>
  <kapitel>
     <ueberschrift>Beschreibung</ueberschrift>
     <absatz>...</absatz>
  </kapitel>
  <kapitel>
     <ueberschrift>Schlußfolgerung</ueberschrift>
     <absatz>...</absatz>
  </kapitel>
</buch>

Die obige wohlgeformte XML-Instanz soll ein konkretes Buch sein. Wenn man von diesem Beispiel ausgeht, erhält man unmittelbar die folgende DTD.

<!ELEMENT buch         (kapitel, kapitel, kapitel) >
<!ELEMENT kapitel      (ueberschrift, absatz)      >
<!ELEMENT ueberschrift (#PCDATA)                   >
<!ELEMENT absatz       (#PCDATA)                   >

Zugegeben, die DTD ist nicht besonders gut. Man könnte sagen, sie passt zu gut. Ihr zufolge besteht ein Buch immer aus genau drei Kapiteln. Pessimistisch formuliert heißt das: Sie haben nun eine schlechte DTD. Optimistisch betrachtet bedeutet dies: Sie haben eine DTD! Sie ist nur ein wenig zu speziell.

Versuchen wir es von der anderen Seite: mit einer generellen DTD. Was ist das generellste, das man über ein Dokument sagen kann? Eben dass es ein Dokument ist. — Auch dafür findet man leicht eine DTD. Wir zeigen sie gleich mit einer Instanz:

Beispiel
<?xml version="1.0"?>
<!DOCTYPE dokument [
  <!ELEMENT dokument (#PCDATA)>
]>
<dokument>
Dies ist ein Beispiel für eine DTD, die
nur einen einzigen Elementtyp kennt.
Keine sehr große Hilfe :-(
</dokument>

Auch hier müssen wir eingestehen, dass die DTD nicht überzeugt. Ein eher absurdes Beispiel. Diese DTD kann man ohne Übertreibung als etwas zu generell bezeichnen. Aber wir haben Ihnen damit die beiden Extreme gezeigt. Irgendwo dazwischen liegt die passende DTD (vgl. Abbildung 53).

Die Suche nach einer
    DTD: Ausgehend
    vom allgemeinen Fall oder von einer konkreten Instanz

Abbildung 53: Die Suche nach einer DTD: Ausgehend vom allgemeinen Fall oder von einer konkreten Instanz

Welchen Startpunkt soll man wählen, eine zu spezielle oder eine zu generelle DTD? Beginnen Sie mit einer zu generellen DTD, taucht schnell ein Problem auf: Sie werden feststellen, dass Sie gern noch das eine oder andere Element hinzufügen möchten. Zum Beispiel soll ein dokument aus einer Folge von Absätzen bestehen. Erst darin darf Text stehen.

Vorsicht!
<?xml version="1.0"?>
<!DOCTYPE dokument [
  <!ELEMENT dokument (absatz+)>
  <!ELEMENT absatz   (#PCDATA)>
]>
<dokument>
Dies ist ein Beispiel für eine DTD, die
nur einen einzigen Elementtyp kennt.
Keine sehr große Hilfe :-(
</dokument>

Mit obigem Beispiel stehen wir schlecht da: Die vorhandenen Instanzen passen nun nicht mehr zu der geänderten DTD (weil innerhalb von dokument jetzt kein Text mehr erlaubt ist). Also müssten alle Instanzen geändert werden. Wenn Sie bereits viele Texte geschrieben haben, ist das nahezu unmöglich.

Was passiert aber im Fall der zu speziellen DTD? Stellen Sie sich vor, Sie schreiben ein weiteres Buch mit vier Kapiteln. Auch hier ist eine Änderung der DTD nötig, die etwa folgendermaßen aussehen kann:

<!ELEMENT buch         (kapitel, kapitel, 
                        kapitel, kapitel?)         >
<!ELEMENT kapitel      (ueberschrift, absatz)      >
<!ELEMENT ueberschrift (#PCDATA)                   >
<!ELEMENT absatz       (#PCDATA)                   >

Jetzt hat der Verfasser die Wahl zwischen drei und vier Kapiteln. Spätestens an dieser Stelle sollte man etwas gesunden Menschenverstand einsetzen und die Kapitelzahl offen gestalten.

<!ELEMENT buch         (kapitel+)                  >
<!ELEMENT kapitel      (ueberschrift, absatz)      >
<!ELEMENT ueberschrift (#PCDATA)                   >
<!ELEMENT absatz       (#PCDATA)                   >

Hier ist nun schließlich gestattet, dass ein Buch ein oder mehr Kapitel besitzt. Der große Vorteil: Die erste Instanz mit drei Kapiteln passt immer noch! Was will man mehr? Wir fassen die Ergebnisse in folgenden Tipps zusammen:

Tipp

Hierarchien von Elementtypen
Die meisten Text-Dokumente, mit denen man üblicherweise zu tun hat, sind sequenzielle Texte, die in der Regel für den Ausdruck oder den Bildschirm konzipiert sind. In der Formatierung bestehen sie aus Textblöcken, die jeweils untereinander stehen. Beispiele dafür sind Absätze, Überschriften, Abbildungen und so weiter. In einem Block befinden sich Textauszeichnungen auf Zeichenebene (Akronym, Personenname, Hervorhebung usw.). Zusammen mit den schon häufig genannten Gliederungselementen (Kapitel, Abschnitt usw.) haben wir nun schon drei Klassen, um Elemente hierarchisch zu gliedern.

Beispiel
Hierarchiestufe Beispiele
Gliederung Kapitel, Abschnitt
Block Absätze, Überschriften, Abbildungen
Zeichen Akronym, Personenname, Hervorhebung

Meist ist es so, dass Elemente der Gliederungsebene Blöcke aufnehmen dürfen (ein Kapitel enthält Absätze, Überschriften usw.). Elemente der Blockebene dürfen Zeichenelemente aufnehmen (in einem Absatz stehen Hervorhebungen, Akronyme usw.).

Tipp

Valid HTML 4.01!Valid CSS!