XMLidP2000

Sitemap

Sitemap

1 Einführung
1.1 Warum mehr weniger ist
1.2 Warum mehr mehr ist
1.3 Wohin die Reise geht
2 Was sind Dokumente?
2.1 Eine kurze Geschichte der Textverarbeitung
2.2 Bestandteile eines Dokumentes
2.3 Die neue, alte Idee: Strukturorientiert schreiben
2.4 Die Entwicklung des Hypertextes
2.5 Textformate im Web
2.6 Das SGML-Konzept: Generic Markup
2.7 Dokumente versus Daten
3 XML im Web
3.1 XML bei der Verwaltung von Websites
3.2 Clientseitige XML-Interpretation
3.2.1 XML mit CSS
3.2.2 XML mit XSL(T)
3.3 XML auf dem Server
3.4 Linking-Möglichkeiten von XML
3.5 XML als Datenaustauschformat
4 XML Quick Start
4.1 Dokumenttyp-Definition (DTD) und Instanzen
4.2 Verarbeitung der Dokumente
4.2.1 Beispiel: Verarbeitung mit Cost/TCL
4.2.2 Beispiel: Verarbeitung mit XSLT
4.2.3 Beispiel: XML/XSLT im Internet Explorer
4.2.4 Fazit
5 XML-DTDs: Die verständliche Beschreibung
5.1 Ein Wort zur Notation
5.2 Dokumente
5.3 Elemente
5.4 Zeichen, Namen und Zeichendaten
5.5 Kommentare
5.6 Processing Instructions
5.7 Wo bleibt Multimedia?
5.8 Dokumenttyp-Definition (DTD)
5.8.1 Elementtyp-Deklaration
5.8.2 Attributlisten-Deklaration
5.8.3 Möglichkeiten, die DTD zu gestalten und zu gliedern
5.8.4 Notation-Deklaration
6 Namensräume in XML
7 XPath: Adressierung von XML-Dokumentteilen
7.1 Zu Grunde liegendes Datenmodell
7.2 Zugriff auf den Datenbaum
7.3 Hilfe von Operatoren
7.4 Kernfunktionen für den Datenzugriff
8 XML: Linking
8.1 Notwendige Begriffe
8.2 XLink: einfache und erweiterte Links
8.2.1 Einfache Verweise
8.2.2 Erweiterte Links
8.2.3 XLink in der Praxis
8.3 XPointer: Verweise in Dokumente hinein
8.3.1 XPath-Erweiterungen in XPointer
9 Überblick über Stylesheet-Sprachen
9.1 Cascading Style Sheets
9.1.1 Wertzuweisungen
9.1.2 Formatierungsmodell
9.1.3 CSS und XML
9.1.4 Ein Beispiel: XML im Mozilla
9.2 Document Style Semantics and Specification Language
9.2.1 Flow Objects
9.2.2 Verarbeitungs-Modus
9.2.3 DSSSL praktisch
9.2.4 Langer Marsch von DSSSL nach HTML
9.3 Extensible Stylesheet Language (XSLT und XSL)
9.3.1 Verhältnis von XSLT zu XSL
9.3.2 Formatierung mit XSL
10 XSL-Transformationen
10.1 Grundsätzliches über Templates
10.2 Ergänzungen zum Datenmodell von XPath
10.3 Struktur von XSLT-Stylesheets
10.4 Den Ergebnisbaum erzeugen
10.4.1 Diverse Basiselemente
10.4.2 Formatierte Nummerierung
10.4.3 Schleifen und bedingte Verarbeitung
10.4.4 Sortieren
10.4.5 Variable und Parameter
10.4.6 Zusätzliche Funktionen
10.4.7 XSLT-Erweiterungen
10.4.8 message, output
11 XSLT in Web-Anwendungen
11.1 XSLT im Internet Explorer
11.2 Linklisten erzeugen
11.3 Details einer Literaturgeschichte
11.3.1 Sortierte Überblicksseiten
11.3.2 Kalender: einzelne Tage ausgeben
12 XML-Editoren
12.1 Übersicht
12.1.1 Emacs + PSGML (mit XML-Unterstützung)
12.1.2 XML Notepad
12.1.3 XML Spy
12.1.4 XMetal
12.1.5 Epic
12.1.6 MarkupKit (für MS Word)
12.1.7 WordPerfect Office2000
12.2 Emacs und PSGML (mit XML-Unterstützung)
12.3 XML-Notepad
12.4 XML Spy
12.5 XMetal
12.6 Epic
12.7 MarkupKit (für MS Word)
12.8 WordPerfect Office2000
12.9 Fazit
13 Entwicklung einer DTD
13.1 Auswahl einer Mehrzweck-DTD
13.2 Entwurf einer DTD
13.2.1 Dokumentanalyse
13.2.2 Tipps und Tricks
13.3 Instanzen ohne DTD
14 Herstellung dieses Buches
14.1 Zielsetzung und Randbedingungen
14.2 Definition der DTD
14.2.1 Schritt 1: Die Grobstruktur
14.2.2 Schritt 2: Elemente auf Zeichenebene
14.2.3 Schritt 3: Die Details
14.3 Formatieren des Manuskriptes
14.3.1 Konvertierung in HTML
14.3.2 Aufbereitung für den Ausdruck
14.4 Erfahrungen mit der zweiten Auflage
15 Anwendungsbeispiel Literatur
15.1 Vorüberlegungen
15.2 En détail: die Autoren in der DTD
15.3 Wie die Daten ins Web gelangen
15.3.1 Inhaltsverzeichnis generieren
15.3.2 Ausgabe der Autorendaten
15.4 Vollständige Listings
15.4.1 DTD für die Literaturgeschichte
15.4.2 DSSSL-Listing: Inhaltsverzeichnis
15.4.3 DSSSL-Listing: Ausgabe eines einzelnen Autors
15.4.4 Perl-Code für Ausgabe einzelner Autoren
16 Verteilte Softwareverwaltung mit XML
16.1 Aufgabenbeschreibung
16.2 XML als Datenbasis
16.3 Bilden von DTD-Hierarchien
16.4 Zusammentragen von verteilten XML-Fragmenten
16.5 Fazit
16.6 Stylesheet zur Transformation in HTML
17 E-Commerce mit XML
17.1 B2B-E-Commerce
17.1.1 Die Rolle von XML
17.1.2 Technische Aspekte
17.2 BMEcat
17.3 Electronic Business XML (ebXML)
17.3.1 Arbeitsgruppen
17.3.2 Zeitplan des Projekts
17.4 XML und EDIFACT
18 XML und Apache
18.1 XML-Transformation per CGI
18.1.1 Konfiguration des Servers
18.1.2 CGI-Skript: xmlhandler.cgi
18.1.3 Beispiel: von HTML nach HTML mit DSSSL oder XSLT
18.2 Cocoon
18.2.1 Extensible Server Pages (XSP)
18.2.2 Beispiel: Formatierung in PDF mit XSL
18.2.3 Beispiel: Simuliertes XLink mit Dynamic HTML/JavaScript
18.2.4 Installation
19 XHTML: Neues HTML 4 — erweiterbar
19.1 Status quo: HTML neu definiert
19.2 Modulare Zukunft
20 Transformation von XML in WML und HTML
20.1 Erzeugen der WML-Dateien
20.2 Erzeugen der HTML-Dateien
21 Ausblick
21.1 XML Schema
21.2 Programmierung mit XML-Daten
21.3 XML und Java
21.4 Resource Description Framework
21.5 Die Zukunft
A Extensible Markup Language (XML) 1.0
A.1 Einleitung
A.1.1 Herkunft und Ziele
A.1.2 Terminologie
A.2 Dokumente
A.2.1 Wohlgeformte XML-Dokumente
A.2.2 Zeichen
A.2.3 Allgemeine syntaktische Konstrukte
A.2.4 Zeichendaten und Markup
A.2.5 Kommentare
A.2.6 Processing Instructions
A.2.7 CDATA-Abschnitte
A.2.8 Prolog und Dokumenttyp-Deklaration
A.2.9 Standalone-Dokumentdeklaration
A.2.10 Behandlung von Leerraum
A.2.11 Behandlung des Zeilenendes
A.2.12 Identifikation der Sprache
A.3 Logische Strukturen
A.3.1 Start-Tags, End-Tags und Leeres-Element-Tags
A.3.2 Elementtyp-Deklarationen
A.3.3 Attributlisten-Deklaration
A.3.4 Bedingte Abschnitte
A.4 Physikalische Strukturen
A.4.1 Zeichen- und Entity-Referenzen
A.4.2 Entity-Deklarationen
A.4.3 Analysierte Entities
A.4.4 Behandlung von Entities und Referenzen durch einen XML-Prozessor
A.4.5 Konstruktion des Ersetzungstextes von internen Entities
A.4.6 Vordefinierte Entities
A.4.7 Notation-Deklarationen
A.4.8 Dokument-Entity
A.5 Konformität
A.5.1 Validierende und nicht-validierende Prozessoren
A.5.2 Benutzen von XML-Prozessoren
A.6 Notation
A.7 Anhang A: Referenzen
A.7.1 Normative Referenzen
A.7.2 Weitere Referenzen
A.8 Anhang B: Zeichenklassen
A.9 Anhang C: XML und SGML (nicht normativ)
A.10 Anhang D: Expansion von Entity- und Zeichenreferenzen (nicht normativ)
A.11 Anhang E: Deterministische Inhaltsmodelle (nicht normativ)
A.12 Anhang F: Automatische Erkennung von Zeichenkodierungen (nicht normativ)
A.13 Anhang G: XML-Arbeitsgruppe des W3C (nicht normativ)
B Verknüpfen von Style Sheets mit XML-Dokumenten Version 1.0
B.1 Die xml-stylesheet-Processing-Instruction
B.2 Anhang A: Referenzen
B.3 Anhang B: Begründung
C Verhältnis von XML zu SGML und HTML
C.1 XML und SGML
C.2 XML und HTML
D Übersichten
D.1 Cascading Style Sheets
D.1.1 CSS-Eigenschaften und -Werte
D.1.2 CSS-Muster
D.2 DSSSL: Flow Objects
D.3 Syntax der XSLT-Elemente
D.4 DTD-Fragment für XSLT-Stylesheets (nicht normativ)
D.5 Relevante Spezifikationen und Organisationen
D.5.1 International Organization for Standardization
D.5.2 World Wide Web Consortium
D.5.3 Organization for the Advancement of Structured Information Standards
D.5.4 Internet Society und Internet Engineering Task Force
D.5.5 ISO-639-Sprachcodes
D.5.6 ISO-3166-Ländercodes
D.5.7 Zeichensatz ISO-Latin-1
D.5.8 Sonderzeichen
D.6 XML-1.0-Regeln

2.6 Das SGML-Konzept: Generic Markup

Nach den Ausflügen in die Hypertext- und Web-Entwicklung kehren wir nun zu den ursprünglichen Fragen der Texterstellung zurück. Was bedeuten die vorausgegangenen Ausführungen für die Praxis? Was ändert sich für den Verfasser? Wie schreibt er seine Texte? — Die Idee des WYSIWYG ist ja nicht vom Himmel gefallen. Selbstverständlich macht es Sinn, etwa beim Desktop-Publishing, das Endergebnis mehr oder weniger exakt auf dem Bildschirm zu sehen. Oft wird aber übersehen, dass eine andere Arbeitsweise durchaus auch ihre Berechtigung hat und manchmal sogar besser geeignet ist.

Beispiel

Stellen Sie sich vor, Sie schreiben einen langen Text, vielleicht einen Aufsatz oder eine technische Dokumentation. Innerhalb des Textes kommt eine Reihe von gleichartigen Textstücken vor, zum Beispiel Zitate, Personennamen, Beispiele, Fachbegriffe und so weiter. Sie möchten für eine konsistente Darstellung von gleichartigen Texten sorgen. Ein Zitat soll also stets gleich erscheinen, etwa vom linken und rechten Rand eingerückt und in kursiver Schriftart. Beim ersten auftretenden Zitat legen Sie dieses Aussehen fest und für Personennamen, Beispiele und all Ihre Textelemente verfahren Sie genauso.

So angenehm es ist, eine schöne Darstellung beim Schreiben zu haben, so lästig ist es doch, wenn Sie 200 Seiten später das nächste Zitat schreiben möchten und sich daran erinnern müssen, wie denn das erste Zitat aussah. War es fett und mit Anführungszeichen versehen oder doch eher serifenlos und in kleinerer Schriftgröße? Und wie sahen die Personennamen aus? Und wie die Beispiele? Was mache ich, wenn ich alle Zitate nachträglich umformatieren möchte; ich muß wohl alle einzeln bearbeiten... — Das Problem sollte klar sein, und viele Programme bieten auch Lösungen an.

In dem Textverarbeitungsprogramm Word gibt es die so genannten Formatvorlagen (vgl. Abbildung 6). Sie erlauben es, für solche Textelemente Namen zu vergeben und diese mit einem bestimmten Format zu verknüpfen. Eine nachträgliche Änderung der Formatierung ist damit auch möglich.

Word: Auswahlfenster für Formatvorlagen

Abbildung 6: Word: Auswahlfenster für Formatvorlagen

Das insbesondere im wissenschaftlichen Bereich beliebte LaTeX-System gestattet die Verwendung von selbst definierten Befehlen, die ähnlich wie Formatvorlagen verwendet werden können. Da LaTeX nicht mit WYSIWYG arbeitet, sondern aus dem geschriebenen Quelldokument in einem Formatierungsprozess eine Ausgabe erzeugt, kann man beim Schreiben sogar Befehle verwenden, die noch nicht definiert sind. Im Gegensatz zu Word, wo eine Formatvorlage definiert sein muss, bevor sie zum erstenmal verwendet wird, ist die LaTeX-Variante noch eine Spur flexibler. Zudem lassen sich die mit Befehlen markierten Texte nicht nur formatieren, sondern beispielsweise auch in das Stichwortverzeichnis einfügen oder zur weiteren Verarbeitung in eine Datei ausgeben.

Beispiel
\documentclass{brief}
% ein Beispiel für eine fiktive 
% Dokumentklasse namens "brief"
 
\begin{brief}
 
\begin{adressat}
 \name{Gordon Shumway}
 \strasse{167 Hemdale Avenue}
 \ort{Los Angeles}
\end{adressat}
 
\betreff{Grüße}
\datum{\today}
 
\anrede{Lieber Gordon,}
 
wie geht es Dir? -- Ich hoffe, wir sehen uns bald wieder!
 
\gruss{Viele Grüße,\\  Deine Rhonda!}
 
\end{brief}
Hinweis

Formatvorlagen von Word oder LaTeXs Befehle erlauben die Verwendung des Generic-Markup-Konzepts mit diesen Programmen. Der Vorteil beim Schreiben des Textes ist, dass man sich keine Gedanken über das Aussehen machen muss. Der Verfasser wird von der Bürde befreit, sich bereits bei der Texterfassung um das Format kümmern zu müssen. Hat man sich erst einmal an diese Arbeitsweise gewöhnt, wird man die neue Freiheit schnell zu schätzen wissen.

Das neue Lieblingswort des Web: Meta-Daten. Den Wert von Daten über Daten kennen Informatiker (und nicht nur die) schon lange, das WWW lernt ihn erst jetzt kennen. Die Begeisterung für alles, was damit zu tun hat — XML, RDF, MCF — ist beim W3C kaum zu übersehen.

XML besitzt einige Gemeinsamkeiten mit den genannten Programmen. Auch hier muss in der Regel, vergleichbar zu Word, bereits vor der Arbeit definiert sein, welche Textelemente es gibtFussnoteIn SGML gilt dies immer; wie die Ausnahme von der Regel in XML aussieht, erläutern wir später.. Was mit den Texten geschieht, ist jedoch nicht festgelegt. Neben der Formatierung ist auch die Erstellung eines Stichwortverzeichnisses möglich, wie zuvor bei LaTeX erwähnt. Dank der Standardisierung von XML, den frei verfügbaren Programmen und der für einen Computer leicht verständlichen Form gehen die Verarbeitungsmöglichkeiten über die von LaTeX und vielen anderen Programmen hinaus. Wesentlich ist auch hier wieder das Generic Markup. XML-Dokumente enthalten Informationen über den Text, so genannte Meta-Daten. Darunter versteht man beispielsweise die oben genannten Informationen Zitat, Personenname und so weiter. Erst dadurch wird es möglich, in einem Dokument etwa nach einer Person zu suchen. Wären dort ausschließlich Formatierungsanweisungen enthalten, könnte ein Computerprogramm nur raten, ob ein Wort ein Name, eine Adresse oder etwas anderes ist. Erst die explizite Speicherung dieser Informationen erlaubt die vernünftige Nutzung von Texten, die über die Darstellung oder den Druck hinausgeht. Arbeitet man ausschließlich formatorientiert, gehen all diese Meta-Daten verloren.

Tabelle 1: Gegenüberstellung von wichtigen Begriffen in LaTeX, Word und SGML/XML.
LaTeX Word SGML/XML
Dokumentklasse Dokumentvorlage Dokumenttyp-Definition
Befehle, Umgebungen Formatvorlagen Elementtypen

Ein weiterer Vorteil des Generic Markup besteht darin, dass man völlig unabhängig vom Ausgabemedium ist. Da einfach gar keine Formatierungsanweisungen gespeichert sind, können diese auch nicht nur für den Ausdruck auf Papier oder die Darstellung auf dem Bildschirm brauchbar sein. Durch die erst nachträgliche Ausgabeaufbereitung kann man ein und dasselbe Dokument auf Papier ausdrucken, auf dem Bildschirm darstellen und sogar vorlesen lassen. Für die letzte Option entwickelte das W3C als Teil der Cascading Style Sheets Level 2 (CSS2) die so genannten Aural style sheets. Sie werden die Zuordnung von solchen Eigenschaften wie Lautstärke, Sprechpause und -Geschwindigkeit oder auch einer Stimmfamilie (männlich, weiblich, kindlich) zu Elementen von HTML gestatten. Diese Informationen versetzen einen Sprachsynthesizer dann in die Lage, eine Web-Seite verständlicher und betont vorzulesen.

Valid HTML 4.01!Valid CSS!