XMLidP2000

Sitemap

Sitemap

1 Einführung
1.1 Warum mehr weniger ist
1.2 Warum mehr mehr ist
1.3 Wohin die Reise geht
2 Was sind Dokumente?
2.1 Eine kurze Geschichte der Textverarbeitung
2.2 Bestandteile eines Dokumentes
2.3 Die neue, alte Idee: Strukturorientiert schreiben
2.4 Die Entwicklung des Hypertextes
2.5 Textformate im Web
2.6 Das SGML-Konzept: Generic Markup
2.7 Dokumente versus Daten
3 XML im Web
3.1 XML bei der Verwaltung von Websites
3.2 Clientseitige XML-Interpretation
3.2.1 XML mit CSS
3.2.2 XML mit XSL(T)
3.3 XML auf dem Server
3.4 Linking-Möglichkeiten von XML
3.5 XML als Datenaustauschformat
4 XML Quick Start
4.1 Dokumenttyp-Definition (DTD) und Instanzen
4.2 Verarbeitung der Dokumente
4.2.1 Beispiel: Verarbeitung mit Cost/TCL
4.2.2 Beispiel: Verarbeitung mit XSLT
4.2.3 Beispiel: XML/XSLT im Internet Explorer
4.2.4 Fazit
5 XML-DTDs: Die verständliche Beschreibung
5.1 Ein Wort zur Notation
5.2 Dokumente
5.3 Elemente
5.4 Zeichen, Namen und Zeichendaten
5.5 Kommentare
5.6 Processing Instructions
5.7 Wo bleibt Multimedia?
5.8 Dokumenttyp-Definition (DTD)
5.8.1 Elementtyp-Deklaration
5.8.2 Attributlisten-Deklaration
5.8.3 Möglichkeiten, die DTD zu gestalten und zu gliedern
5.8.4 Notation-Deklaration
6 Namensräume in XML
7 XPath: Adressierung von XML-Dokumentteilen
7.1 Zu Grunde liegendes Datenmodell
7.2 Zugriff auf den Datenbaum
7.3 Hilfe von Operatoren
7.4 Kernfunktionen für den Datenzugriff
8 XML: Linking
8.1 Notwendige Begriffe
8.2 XLink: einfache und erweiterte Links
8.2.1 Einfache Verweise
8.2.2 Erweiterte Links
8.2.3 XLink in der Praxis
8.3 XPointer: Verweise in Dokumente hinein
8.3.1 XPath-Erweiterungen in XPointer
9 Überblick über Stylesheet-Sprachen
9.1 Cascading Style Sheets
9.1.1 Wertzuweisungen
9.1.2 Formatierungsmodell
9.1.3 CSS und XML
9.1.4 Ein Beispiel: XML im Mozilla
9.2 Document Style Semantics and Specification Language
9.2.1 Flow Objects
9.2.2 Verarbeitungs-Modus
9.2.3 DSSSL praktisch
9.2.4 Langer Marsch von DSSSL nach HTML
9.3 Extensible Stylesheet Language (XSLT und XSL)
9.3.1 Verhältnis von XSLT zu XSL
9.3.2 Formatierung mit XSL
10 XSL-Transformationen
10.1 Grundsätzliches über Templates
10.2 Ergänzungen zum Datenmodell von XPath
10.3 Struktur von XSLT-Stylesheets
10.4 Den Ergebnisbaum erzeugen
10.4.1 Diverse Basiselemente
10.4.2 Formatierte Nummerierung
10.4.3 Schleifen und bedingte Verarbeitung
10.4.4 Sortieren
10.4.5 Variable und Parameter
10.4.6 Zusätzliche Funktionen
10.4.7 XSLT-Erweiterungen
10.4.8 message, output
11 XSLT in Web-Anwendungen
11.1 XSLT im Internet Explorer
11.2 Linklisten erzeugen
11.3 Details einer Literaturgeschichte
11.3.1 Sortierte Überblicksseiten
11.3.2 Kalender: einzelne Tage ausgeben
12 XML-Editoren
12.1 Übersicht
12.1.1 Emacs + PSGML (mit XML-Unterstützung)
12.1.2 XML Notepad
12.1.3 XML Spy
12.1.4 XMetal
12.1.5 Epic
12.1.6 MarkupKit (für MS Word)
12.1.7 WordPerfect Office2000
12.2 Emacs und PSGML (mit XML-Unterstützung)
12.3 XML-Notepad
12.4 XML Spy
12.5 XMetal
12.6 Epic
12.7 MarkupKit (für MS Word)
12.8 WordPerfect Office2000
12.9 Fazit
13 Entwicklung einer DTD
13.1 Auswahl einer Mehrzweck-DTD
13.2 Entwurf einer DTD
13.2.1 Dokumentanalyse
13.2.2 Tipps und Tricks
13.3 Instanzen ohne DTD
14 Herstellung dieses Buches
14.1 Zielsetzung und Randbedingungen
14.2 Definition der DTD
14.2.1 Schritt 1: Die Grobstruktur
14.2.2 Schritt 2: Elemente auf Zeichenebene
14.2.3 Schritt 3: Die Details
14.3 Formatieren des Manuskriptes
14.3.1 Konvertierung in HTML
14.3.2 Aufbereitung für den Ausdruck
14.4 Erfahrungen mit der zweiten Auflage
15 Anwendungsbeispiel Literatur
15.1 Vorüberlegungen
15.2 En détail: die Autoren in der DTD
15.3 Wie die Daten ins Web gelangen
15.3.1 Inhaltsverzeichnis generieren
15.3.2 Ausgabe der Autorendaten
15.4 Vollständige Listings
15.4.1 DTD für die Literaturgeschichte
15.4.2 DSSSL-Listing: Inhaltsverzeichnis
15.4.3 DSSSL-Listing: Ausgabe eines einzelnen Autors
15.4.4 Perl-Code für Ausgabe einzelner Autoren
16 Verteilte Softwareverwaltung mit XML
16.1 Aufgabenbeschreibung
16.2 XML als Datenbasis
16.3 Bilden von DTD-Hierarchien
16.4 Zusammentragen von verteilten XML-Fragmenten
16.5 Fazit
16.6 Stylesheet zur Transformation in HTML
17 E-Commerce mit XML
17.1 B2B-E-Commerce
17.1.1 Die Rolle von XML
17.1.2 Technische Aspekte
17.2 BMEcat
17.3 Electronic Business XML (ebXML)
17.3.1 Arbeitsgruppen
17.3.2 Zeitplan des Projekts
17.4 XML und EDIFACT
18 XML und Apache
18.1 XML-Transformation per CGI
18.1.1 Konfiguration des Servers
18.1.2 CGI-Skript: xmlhandler.cgi
18.1.3 Beispiel: von HTML nach HTML mit DSSSL oder XSLT
18.2 Cocoon
18.2.1 Extensible Server Pages (XSP)
18.2.2 Beispiel: Formatierung in PDF mit XSL
18.2.3 Beispiel: Simuliertes XLink mit Dynamic HTML/JavaScript
18.2.4 Installation
19 XHTML: Neues HTML 4 — erweiterbar
19.1 Status quo: HTML neu definiert
19.2 Modulare Zukunft
20 Transformation von XML in WML und HTML
20.1 Erzeugen der WML-Dateien
20.2 Erzeugen der HTML-Dateien
21 Ausblick
21.1 XML Schema
21.2 Programmierung mit XML-Daten
21.3 XML und Java
21.4 Resource Description Framework
21.5 Die Zukunft
A Extensible Markup Language (XML) 1.0
A.1 Einleitung
A.1.1 Herkunft und Ziele
A.1.2 Terminologie
A.2 Dokumente
A.2.1 Wohlgeformte XML-Dokumente
A.2.2 Zeichen
A.2.3 Allgemeine syntaktische Konstrukte
A.2.4 Zeichendaten und Markup
A.2.5 Kommentare
A.2.6 Processing Instructions
A.2.7 CDATA-Abschnitte
A.2.8 Prolog und Dokumenttyp-Deklaration
A.2.9 Standalone-Dokumentdeklaration
A.2.10 Behandlung von Leerraum
A.2.11 Behandlung des Zeilenendes
A.2.12 Identifikation der Sprache
A.3 Logische Strukturen
A.3.1 Start-Tags, End-Tags und Leeres-Element-Tags
A.3.2 Elementtyp-Deklarationen
A.3.3 Attributlisten-Deklaration
A.3.4 Bedingte Abschnitte
A.4 Physikalische Strukturen
A.4.1 Zeichen- und Entity-Referenzen
A.4.2 Entity-Deklarationen
A.4.3 Analysierte Entities
A.4.4 Behandlung von Entities und Referenzen durch einen XML-Prozessor
A.4.5 Konstruktion des Ersetzungstextes von internen Entities
A.4.6 Vordefinierte Entities
A.4.7 Notation-Deklarationen
A.4.8 Dokument-Entity
A.5 Konformität
A.5.1 Validierende und nicht-validierende Prozessoren
A.5.2 Benutzen von XML-Prozessoren
A.6 Notation
A.7 Anhang A: Referenzen
A.7.1 Normative Referenzen
A.7.2 Weitere Referenzen
A.8 Anhang B: Zeichenklassen
A.9 Anhang C: XML und SGML (nicht normativ)
A.10 Anhang D: Expansion von Entity- und Zeichenreferenzen (nicht normativ)
A.11 Anhang E: Deterministische Inhaltsmodelle (nicht normativ)
A.12 Anhang F: Automatische Erkennung von Zeichenkodierungen (nicht normativ)
A.13 Anhang G: XML-Arbeitsgruppe des W3C (nicht normativ)
B Verknüpfen von Style Sheets mit XML-Dokumenten Version 1.0
B.1 Die xml-stylesheet-Processing-Instruction
B.2 Anhang A: Referenzen
B.3 Anhang B: Begründung
C Verhältnis von XML zu SGML und HTML
C.1 XML und SGML
C.2 XML und HTML
D Übersichten
D.1 Cascading Style Sheets
D.1.1 CSS-Eigenschaften und -Werte
D.1.2 CSS-Muster
D.2 DSSSL: Flow Objects
D.3 Syntax der XSLT-Elemente
D.4 DTD-Fragment für XSLT-Stylesheets (nicht normativ)
D.5 Relevante Spezifikationen und Organisationen
D.5.1 International Organization for Standardization
D.5.2 World Wide Web Consortium
D.5.3 Organization for the Advancement of Structured Information Standards
D.5.4 Internet Society und Internet Engineering Task Force
D.5.5 ISO-639-Sprachcodes
D.5.6 ISO-3166-Ländercodes
D.5.7 Zeichensatz ISO-Latin-1
D.5.8 Sonderzeichen
D.6 XML-1.0-Regeln

14.3.2 Aufbereitung für den Ausdruck

Die Aufbereitung des Manuskripts für den Ausdruck erwies sich als deutlich komplizierter. Dafür gab es eine Reihe von Gründen:

Insbesondere der letzte Punkt war in diesem Fall ein Hindernis. Selbstverständlich sollte das Setzen des Buches vom Setzer des Verlags durchgeführt werden und nur im schlimmsten Fall von den Autoren. Das Manuskript musste also eine Form bekommen, die es erlaubt, die vorhandenen und bekannten Programme (hier FrameMaker) zu verwenden.

Der Weg dorthin war alles andere als geradlinig. Der erste Ansatz bestand darin, mit Hilfe von Jade eine RTF-VersionJade:RTF-Ausgabe zu erzeugen, die über den Import-Filter in FrameMaker geladen werden sollte. Nach anfänglichen Erfolgen mit den rudimentären Elementen, wie zum Beispiel Absätzen, tauchten rasch Probleme auf. Eine Reihe von Abstürzen beim Einladen von RTF in FrameMaker 5.1 (Solaris 2) deuteten auf Schwierigkeiten dieses Programms mit dem Rich Text Format hin. Der Wechsel zu Word bestätigte dies: Word akzeptierte unsere RTF-Dateien klaglos, und wir konnten auch etwas anspruchsvollere Formatierungen mit Jade durchführen. Zwar war Word ganz und gar nicht unser gewünschtes Ziel, für den Augenblick genügte es jedoch.

Bei der Installation eines umfangreichen XML-Systems sollten Sie Ihre Anforderungen genau formulieren und in umfangreichen Testläufen prüfen, ob die von Ihnen gewählte Software den Anforderungen genügt. Dass sich kostenlose Software dabei nicht hinter kommerziellen Produkten verstecken muss, hat die Arbeit an diesem Buch gezeigt.

Das nächste Hindernis stellte dann Jade dar. Für die Internet-Reihe benötigten wir unbedingt Formatierungen in der Marginalspalte. Die in DSSSL dafür vorgesehene Flow Object Class Marginalia beherrschte die Version 1.0.1 von Jade leider nicht. An dieser Stelle haben wir uns darauf konzentriert, ein FrameMaker-Dokument zu erzeugen, welches Formatvorlagen einsetzt. Die Formatvorlagen sollten dem Setzer ermöglichen, das gewünschte Layout zu schaffen. Dass dies mit Jade möglich ist, hat bereits Chris Maden [made97] [made97]Converting SGML to Tagged MIF with Jade, Chris Maden, 1997, http://www.oreilly.com/people/staff/crism/dsssl/sgml2mif.html gezeigt. Er hat mitJade:MIF-Ausgabe Hilfe von Jade und DSSSL die Konvertierung von SGML in Tagged-MIFMIF (Maker Interchange Format) durchgeführt und zwar für die Docbook-DTD. Sein im Web verfügbares Material zeigt jedoch auch, dass dies eine recht aufwendige Arbeit ist — ein Aufwand, vor dem wir angesichts der knappen Terminvorgabe zurückschreckten.

Als wir gerade darüber nachdachten, ob eine auf Cost basierende Lösung geringeren Aufwand bedeuten würde, kam die Rettung in Form einer neuen FrameMaker-Version. Ab der Version 5.5 gibt es nun FrameMaker+SGML. Da wir keine XML-Spezifika, wie etwa die neuen Links nutzen, war der SGML-ImportFrameMaker:SGML-Import genau das, was wir benötigten. Zwar bedeutete auch das Erlernen des Programms einen hohen Zeitaufwand — allein die Dokumentation für den SGML-Import ist fast 500 Seiten stark — aber schließlich versprach dieser Weg, das beste Ergebnis zu liefern.

FrameMaker+SGML speichert strukturelle Informationen in einem so genannten Element Definition Document (EDD). Im wesentlichen erfüllt eine EDD in FrameMaker die Aufgabe einer DTD. Diese enge Verwandtschaft führt dazu, dass man eine initiale EDD einfach durch Einladen der eigenen (SGML-)DTD erhält. In einem zweiten Schritt muss man dann weitgehend manuell jedem Elementtyp der DTD eine gewünschte Formatierung zuordnen. Dieser Schritt war in unserem Fall relativ leicht, da wir bereits eine Musterdatei vom Setzer vorliegen hatten.

Bei den anspruchsvolleren Aufgaben wurde die Arbeit jedoch kompliziert. Man merkt dem Programm den DTP-Hintergrund an. Viele bei DSSSL selbstverständliche Funktionen gibt es bei FrameMaker nicht. Ändern der Reihenfolge von Elementen und das Hinzufügen von Elementen sind beispielsweise nicht möglich. Verschachtelte Tabellen, die im HTML-Tabellenmodell kein Problem sind, beherrscht FrameMaker nicht. Deshalb gestaltete sich der Import unseres Manuskripts schwierig.

Für diese Aufgaben steht zwar ein Ausweg zur Verfügung, jedoch ist der sehr aufwendig: Das Schreiben eines Programms, das über die FrameMaker-API die gewünschten Funktionen ausführt. Diese Option schien uns wenig angenehm. Die Lösung war — wie so oft — Jade. Vor dem Import in FrameMaker haben wir mit Hilfe von Jade alle Aufgaben durchgeführt, die FrameMaker nicht beherrscht. Das Ergebnis war ein Dokument, das sich ohne zusätzliche Programmierung durch Anpassung der Import-Funktion laden läßt. Ein letztes Problem bestand noch darin, dass es FrameMaker scheinbar nicht ermöglicht, die Behandlung von Leerraum zu steuern. In XML/SGML dürfen Leerzeichen und Tabulatoren etwa zum Einrücken benutzt werden. Zur besseren Lesbarkeit unseres Manuskripts haben wir davon ausgiebig Gebrauch gemacht. Leider war es uns nicht möglich, diese mehrfachen Leerzeichen beim Import zu eliminieren. Diese Aufgabe hat schließlich ein kleines sed-Skript übernommenFussnoteIn diesem Zusammenhang danken wir Peek et.al. [porl93] [porl93]UNIX Power Tools, Jerry Peek, Tim O'Reilly, Mike Loukides, Sebastopol/NY, 1993, O'Reilly & Associates/Random House..

Tipp

Für den allgemeinen Fall kann man daraus zweierlei lernen:

Valid HTML 4.01!Valid CSS!