XMLidP2000

Sitemap

Sitemap

1 Einführung
1.1 Warum mehr weniger ist
1.2 Warum mehr mehr ist
1.3 Wohin die Reise geht
2 Was sind Dokumente?
2.1 Eine kurze Geschichte der Textverarbeitung
2.2 Bestandteile eines Dokumentes
2.3 Die neue, alte Idee: Strukturorientiert schreiben
2.4 Die Entwicklung des Hypertextes
2.5 Textformate im Web
2.6 Das SGML-Konzept: Generic Markup
2.7 Dokumente versus Daten
3 XML im Web
3.1 XML bei der Verwaltung von Websites
3.2 Clientseitige XML-Interpretation
3.2.1 XML mit CSS
3.2.2 XML mit XSL(T)
3.3 XML auf dem Server
3.4 Linking-Möglichkeiten von XML
3.5 XML als Datenaustauschformat
4 XML Quick Start
4.1 Dokumenttyp-Definition (DTD) und Instanzen
4.2 Verarbeitung der Dokumente
4.2.1 Beispiel: Verarbeitung mit Cost/TCL
4.2.2 Beispiel: Verarbeitung mit XSLT
4.2.3 Beispiel: XML/XSLT im Internet Explorer
4.2.4 Fazit
5 XML-DTDs: Die verständliche Beschreibung
5.1 Ein Wort zur Notation
5.2 Dokumente
5.3 Elemente
5.4 Zeichen, Namen und Zeichendaten
5.5 Kommentare
5.6 Processing Instructions
5.7 Wo bleibt Multimedia?
5.8 Dokumenttyp-Definition (DTD)
5.8.1 Elementtyp-Deklaration
5.8.2 Attributlisten-Deklaration
5.8.3 Möglichkeiten, die DTD zu gestalten und zu gliedern
5.8.4 Notation-Deklaration
6 Namensräume in XML
7 XPath: Adressierung von XML-Dokumentteilen
7.1 Zu Grunde liegendes Datenmodell
7.2 Zugriff auf den Datenbaum
7.3 Hilfe von Operatoren
7.4 Kernfunktionen für den Datenzugriff
8 XML: Linking
8.1 Notwendige Begriffe
8.2 XLink: einfache und erweiterte Links
8.2.1 Einfache Verweise
8.2.2 Erweiterte Links
8.2.3 XLink in der Praxis
8.3 XPointer: Verweise in Dokumente hinein
8.3.1 XPath-Erweiterungen in XPointer
9 Überblick über Stylesheet-Sprachen
9.1 Cascading Style Sheets
9.1.1 Wertzuweisungen
9.1.2 Formatierungsmodell
9.1.3 CSS und XML
9.1.4 Ein Beispiel: XML im Mozilla
9.2 Document Style Semantics and Specification Language
9.2.1 Flow Objects
9.2.2 Verarbeitungs-Modus
9.2.3 DSSSL praktisch
9.2.4 Langer Marsch von DSSSL nach HTML
9.3 Extensible Stylesheet Language (XSLT und XSL)
9.3.1 Verhältnis von XSLT zu XSL
9.3.2 Formatierung mit XSL
10 XSL-Transformationen
10.1 Grundsätzliches über Templates
10.2 Ergänzungen zum Datenmodell von XPath
10.3 Struktur von XSLT-Stylesheets
10.4 Den Ergebnisbaum erzeugen
10.4.1 Diverse Basiselemente
10.4.2 Formatierte Nummerierung
10.4.3 Schleifen und bedingte Verarbeitung
10.4.4 Sortieren
10.4.5 Variable und Parameter
10.4.6 Zusätzliche Funktionen
10.4.7 XSLT-Erweiterungen
10.4.8 message, output
11 XSLT in Web-Anwendungen
11.1 XSLT im Internet Explorer
11.2 Linklisten erzeugen
11.3 Details einer Literaturgeschichte
11.3.1 Sortierte Überblicksseiten
11.3.2 Kalender: einzelne Tage ausgeben
12 XML-Editoren
12.1 Übersicht
12.1.1 Emacs + PSGML (mit XML-Unterstützung)
12.1.2 XML Notepad
12.1.3 XML Spy
12.1.4 XMetal
12.1.5 Epic
12.1.6 MarkupKit (für MS Word)
12.1.7 WordPerfect Office2000
12.2 Emacs und PSGML (mit XML-Unterstützung)
12.3 XML-Notepad
12.4 XML Spy
12.5 XMetal
12.6 Epic
12.7 MarkupKit (für MS Word)
12.8 WordPerfect Office2000
12.9 Fazit
13 Entwicklung einer DTD
13.1 Auswahl einer Mehrzweck-DTD
13.2 Entwurf einer DTD
13.2.1 Dokumentanalyse
13.2.2 Tipps und Tricks
13.3 Instanzen ohne DTD
14 Herstellung dieses Buches
14.1 Zielsetzung und Randbedingungen
14.2 Definition der DTD
14.2.1 Schritt 1: Die Grobstruktur
14.2.2 Schritt 2: Elemente auf Zeichenebene
14.2.3 Schritt 3: Die Details
14.3 Formatieren des Manuskriptes
14.3.1 Konvertierung in HTML
14.3.2 Aufbereitung für den Ausdruck
14.4 Erfahrungen mit der zweiten Auflage
15 Anwendungsbeispiel Literatur
15.1 Vorüberlegungen
15.2 En détail: die Autoren in der DTD
15.3 Wie die Daten ins Web gelangen
15.3.1 Inhaltsverzeichnis generieren
15.3.2 Ausgabe der Autorendaten
15.4 Vollständige Listings
15.4.1 DTD für die Literaturgeschichte
15.4.2 DSSSL-Listing: Inhaltsverzeichnis
15.4.3 DSSSL-Listing: Ausgabe eines einzelnen Autors
15.4.4 Perl-Code für Ausgabe einzelner Autoren
16 Verteilte Softwareverwaltung mit XML
16.1 Aufgabenbeschreibung
16.2 XML als Datenbasis
16.3 Bilden von DTD-Hierarchien
16.4 Zusammentragen von verteilten XML-Fragmenten
16.5 Fazit
16.6 Stylesheet zur Transformation in HTML
17 E-Commerce mit XML
17.1 B2B-E-Commerce
17.1.1 Die Rolle von XML
17.1.2 Technische Aspekte
17.2 BMEcat
17.3 Electronic Business XML (ebXML)
17.3.1 Arbeitsgruppen
17.3.2 Zeitplan des Projekts
17.4 XML und EDIFACT
18 XML und Apache
18.1 XML-Transformation per CGI
18.1.1 Konfiguration des Servers
18.1.2 CGI-Skript: xmlhandler.cgi
18.1.3 Beispiel: von HTML nach HTML mit DSSSL oder XSLT
18.2 Cocoon
18.2.1 Extensible Server Pages (XSP)
18.2.2 Beispiel: Formatierung in PDF mit XSL
18.2.3 Beispiel: Simuliertes XLink mit Dynamic HTML/JavaScript
18.2.4 Installation
19 XHTML: Neues HTML 4 — erweiterbar
19.1 Status quo: HTML neu definiert
19.2 Modulare Zukunft
20 Transformation von XML in WML und HTML
20.1 Erzeugen der WML-Dateien
20.2 Erzeugen der HTML-Dateien
21 Ausblick
21.1 XML Schema
21.2 Programmierung mit XML-Daten
21.3 XML und Java
21.4 Resource Description Framework
21.5 Die Zukunft
A Extensible Markup Language (XML) 1.0
A.1 Einleitung
A.1.1 Herkunft und Ziele
A.1.2 Terminologie
A.2 Dokumente
A.2.1 Wohlgeformte XML-Dokumente
A.2.2 Zeichen
A.2.3 Allgemeine syntaktische Konstrukte
A.2.4 Zeichendaten und Markup
A.2.5 Kommentare
A.2.6 Processing Instructions
A.2.7 CDATA-Abschnitte
A.2.8 Prolog und Dokumenttyp-Deklaration
A.2.9 Standalone-Dokumentdeklaration
A.2.10 Behandlung von Leerraum
A.2.11 Behandlung des Zeilenendes
A.2.12 Identifikation der Sprache
A.3 Logische Strukturen
A.3.1 Start-Tags, End-Tags und Leeres-Element-Tags
A.3.2 Elementtyp-Deklarationen
A.3.3 Attributlisten-Deklaration
A.3.4 Bedingte Abschnitte
A.4 Physikalische Strukturen
A.4.1 Zeichen- und Entity-Referenzen
A.4.2 Entity-Deklarationen
A.4.3 Analysierte Entities
A.4.4 Behandlung von Entities und Referenzen durch einen XML-Prozessor
A.4.5 Konstruktion des Ersetzungstextes von internen Entities
A.4.6 Vordefinierte Entities
A.4.7 Notation-Deklarationen
A.4.8 Dokument-Entity
A.5 Konformität
A.5.1 Validierende und nicht-validierende Prozessoren
A.5.2 Benutzen von XML-Prozessoren
A.6 Notation
A.7 Anhang A: Referenzen
A.7.1 Normative Referenzen
A.7.2 Weitere Referenzen
A.8 Anhang B: Zeichenklassen
A.9 Anhang C: XML und SGML (nicht normativ)
A.10 Anhang D: Expansion von Entity- und Zeichenreferenzen (nicht normativ)
A.11 Anhang E: Deterministische Inhaltsmodelle (nicht normativ)
A.12 Anhang F: Automatische Erkennung von Zeichenkodierungen (nicht normativ)
A.13 Anhang G: XML-Arbeitsgruppe des W3C (nicht normativ)
B Verknüpfen von Style Sheets mit XML-Dokumenten Version 1.0
B.1 Die xml-stylesheet-Processing-Instruction
B.2 Anhang A: Referenzen
B.3 Anhang B: Begründung
C Verhältnis von XML zu SGML und HTML
C.1 XML und SGML
C.2 XML und HTML
D Übersichten
D.1 Cascading Style Sheets
D.1.1 CSS-Eigenschaften und -Werte
D.1.2 CSS-Muster
D.2 DSSSL: Flow Objects
D.3 Syntax der XSLT-Elemente
D.4 DTD-Fragment für XSLT-Stylesheets (nicht normativ)
D.5 Relevante Spezifikationen und Organisationen
D.5.1 International Organization for Standardization
D.5.2 World Wide Web Consortium
D.5.3 Organization for the Advancement of Structured Information Standards
D.5.4 Internet Society und Internet Engineering Task Force
D.5.5 ISO-639-Sprachcodes
D.5.6 ISO-3166-Ländercodes
D.5.7 Zeichensatz ISO-Latin-1
D.5.8 Sonderzeichen
D.6 XML-1.0-Regeln

9.2.4 Langer Marsch von DSSSL nach HTML

Zur Erinnerung: Eine der DSSSL-Komponenten, die Transformationssprache, ist dazu gedacht, Instanzen einer DTD in die einer anderen DTD zu konvertieren. Leider ist gerade diese Komponente weder für DSSSL-O vorgesehen noch in Jade implementiert. Unter Umständen ist es sinnvoll, XML-Daten in HTML zu wandeln; etwa dann, wenn aus einem umfangreichen Dokument nur ein kleiner Teil an den Browser geschickt werden soll. Bestes Beispiel dafür ist das Inhaltsverzeichnis eines Buches wie dieses. Sicherlich wird sich niemand ein ganzes Buch auf seinen Desktop laden (einige hundert Kilobyte), wenn es nur darum geht, zu wissen, welche Themen denn die Autoren darin behandeln.

James Clarks DSSSL-Maschine Jade bietet eine solche Möglichkeit über nicht standardisierte Flow Objects, die genau diese Transformation bereitstellen. Wie das Inhaltsverzeichnis im Detail aussieht, hängt davon ab, was Scheme-Kundige in eine Funktion stecken, die an der richtigen Stelle des Stylesheets aufgerufen wird (siehe oben den Abschnitt über Modi). Ob das Ergebnis Kapitelüberschriften mit vorgestellter Nummer sind (wie es sich für ein Buch dieser Art anbietet) oder eine Auswahlliste, die nicht gleich alles, sondern per HTML-Formular vielleicht einen scrollbaren Ausschnitt zeigt, ist von der Art der XML-Anwendung abhängig.

Besondere Flow Objects in Jade für die Transformation, die hier als Formatierung behandelt wird

Was die zusätzlichen Flow Objects bewirken, ist die (in Jade nicht enthaltene) Transformationssprache DSSSLs insofern zu ersetzen, als man mit ihrer Hilfe Daten, die einer bestimmten DTD entsprechen, in eine Form wandelt, in der sie einer anderen DTD — zum Beispiel HTML — entsprechen. Will man diese Flow Objects nutzen, muss das eigene Stylesheet sie zu Beginn deklarieren:

Beispiel
(declare-flow-object-class element
  "UNREGISTERED::James Clark//Flow Object Class::element")
(declare-flow-object-class empty-element
  "UNREGISTERED::James Clark//Flow Object Class::empty-element")

element und empty-element lassen sich anschließend im Style Sheet verwenden, indem sie im einfachsten Fall das XML-Element in ein HTML-Element wandeln, beispielsweise

(element absatz
    (make element gi: "P"))

oder im Quelltext nicht vorhandene Elemente wie BR oder HR über das Style Sheet in das HTML-Dokument zu bringen:

(define (horiz-rule) 
    (make empty-element gi: "HR"))

(define (line-break) 
    (make empty-element gi: "BR"))

(element wichtig
    (make element gi: "SPAN"
        attributes: (cons (list "class" "vip")
                    '()) (process-children)))

; ------ Aufruf im Style Sheet:
(line-break)

Das dritte Beispiel hebt mit wichtig markierten Text durch die in einem Stylesheet (hier: CSS) für die Klasse vip definierten Eigenschaften hervor. element resultiert in einem Element, das sowohl ein Start- als auch ein End-Tag enthält, empty-element in einem, das nur ein Start-Tag und keinen Inhalt hat.

Anwendungsbeispiel Wörterbuch

Für ein Online-Wörterbuch von Internet-Begriffen ließe sich ein schmaler FrameFussnoteJa, Frames sind böse, aber dieser Anwendungsfall schreit geradezu nach ihnen, zumal eine Lösung über Cascading Style Sheets wesentlich komplizierter wäre (die kommen hier zwar auch zum Einsatz, bestimmen aber nicht das Layout der gesamten Seite, sondern legen nur Schrifttyp, -größe etc. innerhalb der resultierenden HTML-Datei fest). Mit schlechtem Gewissen also: Frames nur zu Beispielzwecken ... am linken Rand des Browsers denken, in dem die Begriffe oder ihre Akronyme aufgelistet sind, wobei ein Mausklick jeweils in einem weiteren Frame die zugehörige Erklärung zeigt. Dazu wäre das Inhaltsverzeichnis (die Liste der Begriffe) über ein Style Sheet aus dem Gesamtdokument zu extrahieren und in einer Datei zu speichern. Außerdem ist natürlich für jeden Begriff festzulegen, wie der Inhalt (die Erläuterung) in den anderen Frame gelangt.

Die folgende DTD zeigt, wie ein solches Akronym-Wörterbuch aufgebaut sein könnte. Es besteht aus Einträgen, die wiederum ein Akronym, den dazugehörigen Begriff, mindestens eine Erklärung sowie möglicherweise einen URL (oder mehrere) und Quellverweise enthalten.

Beispiel
<!ELEMENT DOCTYPE (dictionary) >

<!ELEMENT dictionary ( entry+ ) >

<!ELEMENT entry ( acro , term* , expl+ , url? , source* ) >

<!ELEMENT acro ( #PCDATA ) >
<!ELEMENT term ( #PCDATA ) >
<!ELEMENT expl ( #PCDATA | p )* >
<!ELEMENT source ( #PCDATA | p | url )* >

<!ELEMENT p ( #PCDATA | em | person)* >

<!ELEMENT person ( fname?, lname ) >
<!ELEMENT fname ( #PCDATA ) >
<!ELEMENT lname ( #PCDATA ) >

<!ELEMENT ref ( #PCDATA ) >
<!ELEMENT url ( #PCDATA ) >
<!ELEMENT em ( #PCDATA ) >

Warum das ganze nicht von Anfang an mit CSS zu erledigen ist, zeigen hier Kleinigkeiten wie die Tatsache, dass man Vor- und Nachnamen von Personen durch ein Leerzeichen trennen möchte — und dafür ist mehr als CSS erforderlich (in diesem Fall natürlich DSSSL, CSS2 wird das auch können). Zwei Elemente sind bei der Gestaltung eines solchen Indexes wichtig: der Wörterbucheintrag und der Begriff oder das AkronymFussnoteNatürlich ist insgesamt noch mehr wichtig, aber hier sollen nur die zentralen Elemente vorkommen. Kapitel 15 enthält ein ähnlich gelagertes Programm, ausführlicher beschrieben..

Zunächst wird das Element des Eintrags definiert (hier entry genannt). Seine Instanzen werden innerhalb eines Absatzes ausgegeben, dadurch dass Folgendes in den Anweisungen für das Top-level-Element dictionary steht:

(make element gi: "P" 
    (process-matching-children 'entry)))

Innerhalb dieses Absatzes sollen die entry-Instanzen in jeweils einer Zeile als anklickbarer String zu sehen sein. Deswegen wird für jede Zeile (durch das leere HTML-Element br) das Akronym in ein A-Element gepackt, das einen Link auf die zugehörigeFussnoteDie Einzeleinträge generiert ein weiteres Stylesheet. Information enthält. Die Funktion string-append setzt die ID und den String ".html" zum Verweis zusammen. Nur für den Frame notwendig ist der target-Zusatz, der festlegt, in welchem Browserfenster das Inhaltsverzeichnis zur Darstellung kommt.

Beispiel
; ----- Details pro Eintrag: Absatz mit einem Akronym pro Zeile

(element entry
    (make sequence 
        (make element gi: "A"
            attributes: (cons (list "HREF" 
                           (string-append (attribute-string "ID") ".html"))
                             (cons (list "TARGET" "DICT")
                      '())) (process-matching-children 'acro))
        (make empty-element gi: "BR")))
Hinweis

Will man vermeiden, dass auch für das letzte Eintragselement ein BR ausgegeben wird (weil es da nicht notwendig, wenn nicht gar unerwünscht ist), muss man die Ausgabe dahingehend ergänzen, dass das Script außer oben stehenden Zeilen für entry eine Zeile enthält, die das letzte Element dieser Art abfragt: (last-sibling?). Analog dazu lässt sich auch das erste Element (first-sibling?) mit if abfragen.

Wie komplex die Beschreibung dessen ist, was mit einem Element zu geschehen hat, hängt wesentlich davon ab, was für ein Dokument als Ergebnis herauskommen soll. Die oben stehenden Vorgaben für entry sorgen lediglich dafür, dass das Akronym (acro) ausgegeben wird. Sollen alle Details des Eintrags im Dokument zu sehen sein, gerät diese Beschreibung erheblich ausführlicher. Ein Beispiel für solche Style Sheets enthält Kapitel 15. Unten stehende Abbildung zeigt, wie das Wörterbuch konkret aussehen kann.

Auf der linken Seite der Frame, in dem die Begriffe
    aufgelistet sind; der Rest ist Ausgabe und
    Ornament.

Abbildung 32: Auf der linken Seite der Frame, in dem die Begriffe aufgelistet sind; der Rest ist Ausgabe und Ornament.

Valid HTML 4.01!Valid CSS!