XMLidP2000

Sitemap

Sitemap

1 Einführung
1.1 Warum mehr weniger ist
1.2 Warum mehr mehr ist
1.3 Wohin die Reise geht
2 Was sind Dokumente?
2.1 Eine kurze Geschichte der Textverarbeitung
2.2 Bestandteile eines Dokumentes
2.3 Die neue, alte Idee: Strukturorientiert schreiben
2.4 Die Entwicklung des Hypertextes
2.5 Textformate im Web
2.6 Das SGML-Konzept: Generic Markup
2.7 Dokumente versus Daten
3 XML im Web
3.1 XML bei der Verwaltung von Websites
3.2 Clientseitige XML-Interpretation
3.2.1 XML mit CSS
3.2.2 XML mit XSL(T)
3.3 XML auf dem Server
3.4 Linking-Möglichkeiten von XML
3.5 XML als Datenaustauschformat
4 XML Quick Start
4.1 Dokumenttyp-Definition (DTD) und Instanzen
4.2 Verarbeitung der Dokumente
4.2.1 Beispiel: Verarbeitung mit Cost/TCL
4.2.2 Beispiel: Verarbeitung mit XSLT
4.2.3 Beispiel: XML/XSLT im Internet Explorer
4.2.4 Fazit
5 XML-DTDs: Die verständliche Beschreibung
5.1 Ein Wort zur Notation
5.2 Dokumente
5.3 Elemente
5.4 Zeichen, Namen und Zeichendaten
5.5 Kommentare
5.6 Processing Instructions
5.7 Wo bleibt Multimedia?
5.8 Dokumenttyp-Definition (DTD)
5.8.1 Elementtyp-Deklaration
5.8.2 Attributlisten-Deklaration
5.8.3 Möglichkeiten, die DTD zu gestalten und zu gliedern
5.8.4 Notation-Deklaration
6 Namensräume in XML
7 XPath: Adressierung von XML-Dokumentteilen
7.1 Zu Grunde liegendes Datenmodell
7.2 Zugriff auf den Datenbaum
7.3 Hilfe von Operatoren
7.4 Kernfunktionen für den Datenzugriff
8 XML: Linking
8.1 Notwendige Begriffe
8.2 XLink: einfache und erweiterte Links
8.2.1 Einfache Verweise
8.2.2 Erweiterte Links
8.2.3 XLink in der Praxis
8.3 XPointer: Verweise in Dokumente hinein
8.3.1 XPath-Erweiterungen in XPointer
9 Überblick über Stylesheet-Sprachen
9.1 Cascading Style Sheets
9.1.1 Wertzuweisungen
9.1.2 Formatierungsmodell
9.1.3 CSS und XML
9.1.4 Ein Beispiel: XML im Mozilla
9.2 Document Style Semantics and Specification Language
9.2.1 Flow Objects
9.2.2 Verarbeitungs-Modus
9.2.3 DSSSL praktisch
9.2.4 Langer Marsch von DSSSL nach HTML
9.3 Extensible Stylesheet Language (XSLT und XSL)
9.3.1 Verhältnis von XSLT zu XSL
9.3.2 Formatierung mit XSL
10 XSL-Transformationen
10.1 Grundsätzliches über Templates
10.2 Ergänzungen zum Datenmodell von XPath
10.3 Struktur von XSLT-Stylesheets
10.4 Den Ergebnisbaum erzeugen
10.4.1 Diverse Basiselemente
10.4.2 Formatierte Nummerierung
10.4.3 Schleifen und bedingte Verarbeitung
10.4.4 Sortieren
10.4.5 Variable und Parameter
10.4.6 Zusätzliche Funktionen
10.4.7 XSLT-Erweiterungen
10.4.8 message, output
11 XSLT in Web-Anwendungen
11.1 XSLT im Internet Explorer
11.2 Linklisten erzeugen
11.3 Details einer Literaturgeschichte
11.3.1 Sortierte Überblicksseiten
11.3.2 Kalender: einzelne Tage ausgeben
12 XML-Editoren
12.1 Übersicht
12.1.1 Emacs + PSGML (mit XML-Unterstützung)
12.1.2 XML Notepad
12.1.3 XML Spy
12.1.4 XMetal
12.1.5 Epic
12.1.6 MarkupKit (für MS Word)
12.1.7 WordPerfect Office2000
12.2 Emacs und PSGML (mit XML-Unterstützung)
12.3 XML-Notepad
12.4 XML Spy
12.5 XMetal
12.6 Epic
12.7 MarkupKit (für MS Word)
12.8 WordPerfect Office2000
12.9 Fazit
13 Entwicklung einer DTD
13.1 Auswahl einer Mehrzweck-DTD
13.2 Entwurf einer DTD
13.2.1 Dokumentanalyse
13.2.2 Tipps und Tricks
13.3 Instanzen ohne DTD
14 Herstellung dieses Buches
14.1 Zielsetzung und Randbedingungen
14.2 Definition der DTD
14.2.1 Schritt 1: Die Grobstruktur
14.2.2 Schritt 2: Elemente auf Zeichenebene
14.2.3 Schritt 3: Die Details
14.3 Formatieren des Manuskriptes
14.3.1 Konvertierung in HTML
14.3.2 Aufbereitung für den Ausdruck
14.4 Erfahrungen mit der zweiten Auflage
15 Anwendungsbeispiel Literatur
15.1 Vorüberlegungen
15.2 En détail: die Autoren in der DTD
15.3 Wie die Daten ins Web gelangen
15.3.1 Inhaltsverzeichnis generieren
15.3.2 Ausgabe der Autorendaten
15.4 Vollständige Listings
15.4.1 DTD für die Literaturgeschichte
15.4.2 DSSSL-Listing: Inhaltsverzeichnis
15.4.3 DSSSL-Listing: Ausgabe eines einzelnen Autors
15.4.4 Perl-Code für Ausgabe einzelner Autoren
16 Verteilte Softwareverwaltung mit XML
16.1 Aufgabenbeschreibung
16.2 XML als Datenbasis
16.3 Bilden von DTD-Hierarchien
16.4 Zusammentragen von verteilten XML-Fragmenten
16.5 Fazit
16.6 Stylesheet zur Transformation in HTML
17 E-Commerce mit XML
17.1 B2B-E-Commerce
17.1.1 Die Rolle von XML
17.1.2 Technische Aspekte
17.2 BMEcat
17.3 Electronic Business XML (ebXML)
17.3.1 Arbeitsgruppen
17.3.2 Zeitplan des Projekts
17.4 XML und EDIFACT
18 XML und Apache
18.1 XML-Transformation per CGI
18.1.1 Konfiguration des Servers
18.1.2 CGI-Skript: xmlhandler.cgi
18.1.3 Beispiel: von HTML nach HTML mit DSSSL oder XSLT
18.2 Cocoon
18.2.1 Extensible Server Pages (XSP)
18.2.2 Beispiel: Formatierung in PDF mit XSL
18.2.3 Beispiel: Simuliertes XLink mit Dynamic HTML/JavaScript
18.2.4 Installation
19 XHTML: Neues HTML 4 — erweiterbar
19.1 Status quo: HTML neu definiert
19.2 Modulare Zukunft
20 Transformation von XML in WML und HTML
20.1 Erzeugen der WML-Dateien
20.2 Erzeugen der HTML-Dateien
21 Ausblick
21.1 XML Schema
21.2 Programmierung mit XML-Daten
21.3 XML und Java
21.4 Resource Description Framework
21.5 Die Zukunft
A Extensible Markup Language (XML) 1.0
A.1 Einleitung
A.1.1 Herkunft und Ziele
A.1.2 Terminologie
A.2 Dokumente
A.2.1 Wohlgeformte XML-Dokumente
A.2.2 Zeichen
A.2.3 Allgemeine syntaktische Konstrukte
A.2.4 Zeichendaten und Markup
A.2.5 Kommentare
A.2.6 Processing Instructions
A.2.7 CDATA-Abschnitte
A.2.8 Prolog und Dokumenttyp-Deklaration
A.2.9 Standalone-Dokumentdeklaration
A.2.10 Behandlung von Leerraum
A.2.11 Behandlung des Zeilenendes
A.2.12 Identifikation der Sprache
A.3 Logische Strukturen
A.3.1 Start-Tags, End-Tags und Leeres-Element-Tags
A.3.2 Elementtyp-Deklarationen
A.3.3 Attributlisten-Deklaration
A.3.4 Bedingte Abschnitte
A.4 Physikalische Strukturen
A.4.1 Zeichen- und Entity-Referenzen
A.4.2 Entity-Deklarationen
A.4.3 Analysierte Entities
A.4.4 Behandlung von Entities und Referenzen durch einen XML-Prozessor
A.4.5 Konstruktion des Ersetzungstextes von internen Entities
A.4.6 Vordefinierte Entities
A.4.7 Notation-Deklarationen
A.4.8 Dokument-Entity
A.5 Konformität
A.5.1 Validierende und nicht-validierende Prozessoren
A.5.2 Benutzen von XML-Prozessoren
A.6 Notation
A.7 Anhang A: Referenzen
A.7.1 Normative Referenzen
A.7.2 Weitere Referenzen
A.8 Anhang B: Zeichenklassen
A.9 Anhang C: XML und SGML (nicht normativ)
A.10 Anhang D: Expansion von Entity- und Zeichenreferenzen (nicht normativ)
A.11 Anhang E: Deterministische Inhaltsmodelle (nicht normativ)
A.12 Anhang F: Automatische Erkennung von Zeichenkodierungen (nicht normativ)
A.13 Anhang G: XML-Arbeitsgruppe des W3C (nicht normativ)
B Verknüpfen von Style Sheets mit XML-Dokumenten Version 1.0
B.1 Die xml-stylesheet-Processing-Instruction
B.2 Anhang A: Referenzen
B.3 Anhang B: Begründung
C Verhältnis von XML zu SGML und HTML
C.1 XML und SGML
C.2 XML und HTML
D Übersichten
D.1 Cascading Style Sheets
D.1.1 CSS-Eigenschaften und -Werte
D.1.2 CSS-Muster
D.2 DSSSL: Flow Objects
D.3 Syntax der XSLT-Elemente
D.4 DTD-Fragment für XSLT-Stylesheets (nicht normativ)
D.5 Relevante Spezifikationen und Organisationen
D.5.1 International Organization for Standardization
D.5.2 World Wide Web Consortium
D.5.3 Organization for the Advancement of Structured Information Standards
D.5.4 Internet Society und Internet Engineering Task Force
D.5.5 ISO-639-Sprachcodes
D.5.6 ISO-3166-Ländercodes
D.5.7 Zeichensatz ISO-Latin-1
D.5.8 Sonderzeichen
D.6 XML-1.0-Regeln

18.1.2 CGI-Skript: xmlhandler.cgi

Bevor wir uns das Skript ansehen, ein kurzer Blick auf ein Beispieldokument. Das folgende Listing zeigt einen Ausschnitt aus einer Bundesliga-Tabelle, die mit XML-Auszeichnungen versehen ist. Es handelt sich um eine gültige Instanz mit eingebetteter DTD.

Beispiel
<?stylesheet href="liga.dsl" type="text/dsssl"?> 
<?xml version="1.0" standalone="yes" encoding="ISO-8859-1"?>
<!DOCTYPE liga [
  <!ELEMENT liga    (pos+)                 >
  <!ELEMENT pos     (verein, punkte, tore) >
  <!ELEMENT verein  (#PCDATA)              >
  <!ELEMENT punkte  (#PCDATA)              >
  <!ELEMENT tore    (#PCDATA)              >
]>
<liga>
  <pos>
    <verein>Kaiserslautern</verein>
    <punkte>45</punkte>
    <tore>+17</tore>
  </pos>
  <pos>
    <verein>B. München</verein>
    <punkte>41</punkte>
    <tore>+18</tore>
  </pos>
<!-- hier stehen noch mehr Vereine -->
  <pos>
    <verein>VfL Bochum</verein>
    <punkte>20</punkte>
    <tore>-9</tore>
  </pos>
  <pos>
    <verein>1. FC Köln</verein>
    <punkte>20</punkte>
    <tore>-13</tore>
  </pos>
</liga>

Die erste Zeile ist hier der interessante Teil. Diese Processing Instruction stellt die Verbindung mit einem DSSSL-Stylesheet her, und zwar in einer Form, die James Clarks DSSSL-Maschine Jade versteht. Hier muss man sagen, dass es sich um eine proprietäre Regelung handelt. Die offizielle, vom W3C abgesegnete Variante (siehe Anhang B ) sieht zum Beispiel so aus:

<?xml-stylesheet href="htmltoc.xsl" type="text/xsl"?>

Der xmlhandler soll natürlich mit verschiedenen Stylesheets umgehen können. Das CGI-Skript muss daher selbstständig ermitteln, welches Stylesheet und welcher Prozessor benötigt werden. Im nächsten Listing (ein Bourne-Shell-Skript) ist dies als Schritt 2 zu erkennen. An dieser Stelle sei erwähnt, dass wir nachfolgende Beispiele unter Unix (genauer Solaris 2) getestet haben.

#!/bin/sh

#
# XML-Handler - Wrapper zur Umwandlung von XML in HTML mit XSL oder DSSSL
#

PATH=/usr/bin/:/app/unido-inf/sun4_55/jdk/1.1.6/bin/:${PATH}
export PATH

# 
# Konfiguration fuer Jade und XT
#
JADEBIN=/app/unido-inf/sun4_55/jade/1.2.1/bin/jade
CATALOG=/app/unido-inf/sun4_55/jade/1.2.1/dsssl/catalog
CLASSPATH=/app/unido-inf/sun4_55/xp/0.5:/app/unido-inf/sun4_55/xp/0.5/xp.jar:/app/unido-inf/sun4_55/xt/19990514/xt.jar:/app/unido-inf/sun4_55/xt/19990514/sax.jar:/app/unido-inf/sun4_55/jdk/1.1.6/lib/classes.zip:${CLASSPATH}
export CLASSPATH
#
# XTWRAPPER ist ein Shell-Skript, das den Aufruf von java mit
# den notwendigen Klassen und Parametern regelt
XTWRAPPER=/app/unido-inf/sun4_55/xt/19990514/bin/xt
JDKHOME=/app/unido-inf/sun4_55/jdk/1.1.6
export JDKHOME
JAVA_HOME=/app/unido-inf/sun4_55/jdk/1.1.6
export JAVA_HOME

#
# 1) Name der XML-Datei
#
XMLDATEI=${PATH_TRANSLATED}


#
# 2) Herausfinden, welchen MIME-Typ das zugehoerige StyleSheet verwendet
#
StyleSheetMIME=`grep stylesheet ${XMLDATEI} | sed 's/.*type="\([^\"]*\)".*/\1/'`





if [ "${StyleSheetMIME}" = "text/dsssl" ]
then

    #
    # 3) Bei DSSSL-StyleSheets unmittelbar Jade aufrufen
    #

    #
    # HTTP-Header:
    #
    echo "Content-type: text/html"
    echo

    ${JADEBIN} -c ${CATALOG} -t sgml ${XMLDATEI}

    #
    # abschliessendes LF, weil Jade es unterdrueckt
    echo
    exit

else if [ "${StyleSheetMIME}" = "text/xsl" ]
    then

        #
        # 4) Falls der Browser XSL beherrscht, keine Transformation durchfuehren
        #
        ACCEPT=`echo ${HTTP_ACCEPT} | sed 's|.*\(text/xsl\).*|\1|'`
        if [ "${ACCEPT}" = "text/xsl" ]
        then
            #
            # HTTP-Header:
            #
            echo "Content-type: text/xml"
            echo
            cat ${XMLDATEI}

        else

            #
            # HTTP-Header:
            #
            echo "Content-type: text/html"
            echo

            #
            # 5) Transformieren: zuerst den Namen des XSLT-StyleSheets ermitteln
            #
    

            XSLSS=`grep stylesheet ${XMLDATEI} | sed 's/.*href="\([^\"]*\)".*/\1/'`
            DIRECTORY=`echo ${XMLDATEI} | sed 's|^\(.*/\)[^/]*$|\1|'`

            cd ${DIRECTORY}


            ${XTWRAPPER} ${XMLDATEI} ${XSLSS} 
        fi

        exit
    else
        echo "<h1>Interner Fehler</h1><h2>${StyleSheetMIME}</h2>"
    fi
fi

Der erste Teil des Skripts dient nur der Konfiguration des XSLT-Programms XT und des DSSSL-Programms Jade, beide stammen aus der Feder von James Clark. Als erste Aktion (1) stellt das Skript den Dateinamen der XML-Datei fest. Dieser ist in der CGI-Variablen PATH_TRANSLATED zu finden. Schritt (2) sucht die Stylesheet-Processing-Instruction und extrahiert mit Hilfe des sedFussnoteDer stream editor steht praktisch in jeder Unix-Variante zur Verfügung. den MIME-Typ (hier text/xsl oder text/dsssl). Von nun an gliedert sich das Skript in jeweils einen Block für jeden unterstützten Stylesheet-Typ. Im Fall eines DSSSL-Stylesheets wird unmittelbar die Transformation in HTML mit Jade aktiviert (Jade findet das Stylesheet selbstständig und benötigt dafür keinen Parameter). Etwas anderes als die Transformation ist nicht möglich, da kein bekannter Browser DSSSL beherrscht. Im Fall von XSL kann es sein, dass der Browser damit umgehen kann. Deshalb prüft das Skript in Punkt (4) den Inhalt der Variablen HTTP_ACCEPT. Findet sich darin der Eintrag text/xsl, so kann die XML-Datei ohne Umwandlung ausgeliefert werden. An dieser Stelle sei noch erwähnt, dass man sich bei dieser Content-Negotiation nicht unbedingt auf den Browser verlassen kann. So schickt der Navigator schon seit mehreren Versionen als akzeptierten MIME-Typ die Zeichenkette */*. Da diese Angabe nicht wörtlich zu nehmen ist, erfolgt hier die explizite Prüfung auf text/xsl. Falls der Browser XSL nicht beherrscht, transformiert das Skript wie zuvor von XML in HTML, diesmal unter Beihilfe von XT (5). Andere Fälle sollten nicht vorkommen, der letzte else-Zweig des Skriptes ist nur als exemplarische Fehlermeldung zu verstehen, die anzeigt, dass ein unbekannter Stylesheet-Typ gefunden wurde.

Die wesentlichen Teile sind damit bereits fertig gestellt. Aber das Beispiel des oben gezeigten XML-Dokuments ist ohne Stylesheet noch nicht komplett. Das zugehörige DSSSL-Programm ist im folgenden Listing zu finden.

<!DOCTYPE style-sheet PUBLIC "-//James Clark//DTD DSSSL Style Sheet//EN">
(declare-flow-object-class element
  "UNREGISTERED::James Clark//Flow Object Class::element")


(element liga
  (make element gi: "table"
        attributes: (cons (list "border" "1")
                                      '())
        (make element gi: "tr"           ; Kopfzeile der Tabelle
              (make sequence
                (make element gi: "th"
                      (literal "Mannschaft"))
                (make element gi: "th"
                      (literal "Punkte"))
                (make element gi: "th"
                      (literal "Tor-Verhältnis"))))
        (process-children)))             ; Inhalt der Tabelle

(element pos
  (make element gi: "tr"))

(element verein
  (make element gi: "td"))

(element punkte
  (make element gi: "td"))

(element tore
  (make element gi: "td"))

Lädt man nun die Datei beispiel.xml, so zeigt der Browser die Ansicht in Abbildung 64, also eine Transformation der XML-Datei in eine HTML-Tabelle.

Aus XML und DSSSL
      automatisch erzeugte HTML-Ausgabe

Abbildung 64: Aus XML und DSSSL automatisch erzeugte HTML-Ausgabe

Das Beispiel der Bundesliga-Tabelle enthält ein ganz einfaches Dokument, eben nur eine Tabelle. Es ist absichtlich schlicht gewählt, weil es hier nicht um die Komplexität von XML-Dokumenten gehen soll, sondern nur um die serverseitige Behandlung. Um aber doch noch ein etwas umfangreicheres Beispiel zu zeigen, bietet sich die Konvertierung von HTML in HTML an. Zunächst erscheint das vielleicht sinnlos, aber die folgende Anwendung verdeutlicht den Zweck.

Valid HTML 4.01!Valid CSS!