XMLidP2000

Sitemap

Sitemap

1 Einführung
1.1 Warum mehr weniger ist
1.2 Warum mehr mehr ist
1.3 Wohin die Reise geht
2 Was sind Dokumente?
2.1 Eine kurze Geschichte der Textverarbeitung
2.2 Bestandteile eines Dokumentes
2.3 Die neue, alte Idee: Strukturorientiert schreiben
2.4 Die Entwicklung des Hypertextes
2.5 Textformate im Web
2.6 Das SGML-Konzept: Generic Markup
2.7 Dokumente versus Daten
3 XML im Web
3.1 XML bei der Verwaltung von Websites
3.2 Clientseitige XML-Interpretation
3.2.1 XML mit CSS
3.2.2 XML mit XSL(T)
3.3 XML auf dem Server
3.4 Linking-Möglichkeiten von XML
3.5 XML als Datenaustauschformat
4 XML Quick Start
4.1 Dokumenttyp-Definition (DTD) und Instanzen
4.2 Verarbeitung der Dokumente
4.2.1 Beispiel: Verarbeitung mit Cost/TCL
4.2.2 Beispiel: Verarbeitung mit XSLT
4.2.3 Beispiel: XML/XSLT im Internet Explorer
4.2.4 Fazit
5 XML-DTDs: Die verständliche Beschreibung
5.1 Ein Wort zur Notation
5.2 Dokumente
5.3 Elemente
5.4 Zeichen, Namen und Zeichendaten
5.5 Kommentare
5.6 Processing Instructions
5.7 Wo bleibt Multimedia?
5.8 Dokumenttyp-Definition (DTD)
5.8.1 Elementtyp-Deklaration
5.8.2 Attributlisten-Deklaration
5.8.3 Möglichkeiten, die DTD zu gestalten und zu gliedern
5.8.4 Notation-Deklaration
6 Namensräume in XML
7 XPath: Adressierung von XML-Dokumentteilen
7.1 Zu Grunde liegendes Datenmodell
7.2 Zugriff auf den Datenbaum
7.3 Hilfe von Operatoren
7.4 Kernfunktionen für den Datenzugriff
8 XML: Linking
8.1 Notwendige Begriffe
8.2 XLink: einfache und erweiterte Links
8.2.1 Einfache Verweise
8.2.2 Erweiterte Links
8.2.3 XLink in der Praxis
8.3 XPointer: Verweise in Dokumente hinein
8.3.1 XPath-Erweiterungen in XPointer
9 Überblick über Stylesheet-Sprachen
9.1 Cascading Style Sheets
9.1.1 Wertzuweisungen
9.1.2 Formatierungsmodell
9.1.3 CSS und XML
9.1.4 Ein Beispiel: XML im Mozilla
9.2 Document Style Semantics and Specification Language
9.2.1 Flow Objects
9.2.2 Verarbeitungs-Modus
9.2.3 DSSSL praktisch
9.2.4 Langer Marsch von DSSSL nach HTML
9.3 Extensible Stylesheet Language (XSLT und XSL)
9.3.1 Verhältnis von XSLT zu XSL
9.3.2 Formatierung mit XSL
10 XSL-Transformationen
10.1 Grundsätzliches über Templates
10.2 Ergänzungen zum Datenmodell von XPath
10.3 Struktur von XSLT-Stylesheets
10.4 Den Ergebnisbaum erzeugen
10.4.1 Diverse Basiselemente
10.4.2 Formatierte Nummerierung
10.4.3 Schleifen und bedingte Verarbeitung
10.4.4 Sortieren
10.4.5 Variable und Parameter
10.4.6 Zusätzliche Funktionen
10.4.7 XSLT-Erweiterungen
10.4.8 message, output
11 XSLT in Web-Anwendungen
11.1 XSLT im Internet Explorer
11.2 Linklisten erzeugen
11.3 Details einer Literaturgeschichte
11.3.1 Sortierte Überblicksseiten
11.3.2 Kalender: einzelne Tage ausgeben
12 XML-Editoren
12.1 Übersicht
12.1.1 Emacs + PSGML (mit XML-Unterstützung)
12.1.2 XML Notepad
12.1.3 XML Spy
12.1.4 XMetal
12.1.5 Epic
12.1.6 MarkupKit (für MS Word)
12.1.7 WordPerfect Office2000
12.2 Emacs und PSGML (mit XML-Unterstützung)
12.3 XML-Notepad
12.4 XML Spy
12.5 XMetal
12.6 Epic
12.7 MarkupKit (für MS Word)
12.8 WordPerfect Office2000
12.9 Fazit
13 Entwicklung einer DTD
13.1 Auswahl einer Mehrzweck-DTD
13.2 Entwurf einer DTD
13.2.1 Dokumentanalyse
13.2.2 Tipps und Tricks
13.3 Instanzen ohne DTD
14 Herstellung dieses Buches
14.1 Zielsetzung und Randbedingungen
14.2 Definition der DTD
14.2.1 Schritt 1: Die Grobstruktur
14.2.2 Schritt 2: Elemente auf Zeichenebene
14.2.3 Schritt 3: Die Details
14.3 Formatieren des Manuskriptes
14.3.1 Konvertierung in HTML
14.3.2 Aufbereitung für den Ausdruck
14.4 Erfahrungen mit der zweiten Auflage
15 Anwendungsbeispiel Literatur
15.1 Vorüberlegungen
15.2 En détail: die Autoren in der DTD
15.3 Wie die Daten ins Web gelangen
15.3.1 Inhaltsverzeichnis generieren
15.3.2 Ausgabe der Autorendaten
15.4 Vollständige Listings
15.4.1 DTD für die Literaturgeschichte
15.4.2 DSSSL-Listing: Inhaltsverzeichnis
15.4.3 DSSSL-Listing: Ausgabe eines einzelnen Autors
15.4.4 Perl-Code für Ausgabe einzelner Autoren
16 Verteilte Softwareverwaltung mit XML
16.1 Aufgabenbeschreibung
16.2 XML als Datenbasis
16.3 Bilden von DTD-Hierarchien
16.4 Zusammentragen von verteilten XML-Fragmenten
16.5 Fazit
16.6 Stylesheet zur Transformation in HTML
17 E-Commerce mit XML
17.1 B2B-E-Commerce
17.1.1 Die Rolle von XML
17.1.2 Technische Aspekte
17.2 BMEcat
17.3 Electronic Business XML (ebXML)
17.3.1 Arbeitsgruppen
17.3.2 Zeitplan des Projekts
17.4 XML und EDIFACT
18 XML und Apache
18.1 XML-Transformation per CGI
18.1.1 Konfiguration des Servers
18.1.2 CGI-Skript: xmlhandler.cgi
18.1.3 Beispiel: von HTML nach HTML mit DSSSL oder XSLT
18.2 Cocoon
18.2.1 Extensible Server Pages (XSP)
18.2.2 Beispiel: Formatierung in PDF mit XSL
18.2.3 Beispiel: Simuliertes XLink mit Dynamic HTML/JavaScript
18.2.4 Installation
19 XHTML: Neues HTML 4 — erweiterbar
19.1 Status quo: HTML neu definiert
19.2 Modulare Zukunft
20 Transformation von XML in WML und HTML
20.1 Erzeugen der WML-Dateien
20.2 Erzeugen der HTML-Dateien
21 Ausblick
21.1 XML Schema
21.2 Programmierung mit XML-Daten
21.3 XML und Java
21.4 Resource Description Framework
21.5 Die Zukunft
A Extensible Markup Language (XML) 1.0
A.1 Einleitung
A.1.1 Herkunft und Ziele
A.1.2 Terminologie
A.2 Dokumente
A.2.1 Wohlgeformte XML-Dokumente
A.2.2 Zeichen
A.2.3 Allgemeine syntaktische Konstrukte
A.2.4 Zeichendaten und Markup
A.2.5 Kommentare
A.2.6 Processing Instructions
A.2.7 CDATA-Abschnitte
A.2.8 Prolog und Dokumenttyp-Deklaration
A.2.9 Standalone-Dokumentdeklaration
A.2.10 Behandlung von Leerraum
A.2.11 Behandlung des Zeilenendes
A.2.12 Identifikation der Sprache
A.3 Logische Strukturen
A.3.1 Start-Tags, End-Tags und Leeres-Element-Tags
A.3.2 Elementtyp-Deklarationen
A.3.3 Attributlisten-Deklaration
A.3.4 Bedingte Abschnitte
A.4 Physikalische Strukturen
A.4.1 Zeichen- und Entity-Referenzen
A.4.2 Entity-Deklarationen
A.4.3 Analysierte Entities
A.4.4 Behandlung von Entities und Referenzen durch einen XML-Prozessor
A.4.5 Konstruktion des Ersetzungstextes von internen Entities
A.4.6 Vordefinierte Entities
A.4.7 Notation-Deklarationen
A.4.8 Dokument-Entity
A.5 Konformität
A.5.1 Validierende und nicht-validierende Prozessoren
A.5.2 Benutzen von XML-Prozessoren
A.6 Notation
A.7 Anhang A: Referenzen
A.7.1 Normative Referenzen
A.7.2 Weitere Referenzen
A.8 Anhang B: Zeichenklassen
A.9 Anhang C: XML und SGML (nicht normativ)
A.10 Anhang D: Expansion von Entity- und Zeichenreferenzen (nicht normativ)
A.11 Anhang E: Deterministische Inhaltsmodelle (nicht normativ)
A.12 Anhang F: Automatische Erkennung von Zeichenkodierungen (nicht normativ)
A.13 Anhang G: XML-Arbeitsgruppe des W3C (nicht normativ)
B Verknüpfen von Style Sheets mit XML-Dokumenten Version 1.0
B.1 Die xml-stylesheet-Processing-Instruction
B.2 Anhang A: Referenzen
B.3 Anhang B: Begründung
C Verhältnis von XML zu SGML und HTML
C.1 XML und SGML
C.2 XML und HTML
D Übersichten
D.1 Cascading Style Sheets
D.1.1 CSS-Eigenschaften und -Werte
D.1.2 CSS-Muster
D.2 DSSSL: Flow Objects
D.3 Syntax der XSLT-Elemente
D.4 DTD-Fragment für XSLT-Stylesheets (nicht normativ)
D.5 Relevante Spezifikationen und Organisationen
D.5.1 International Organization for Standardization
D.5.2 World Wide Web Consortium
D.5.3 Organization for the Advancement of Structured Information Standards
D.5.4 Internet Society und Internet Engineering Task Force
D.5.5 ISO-639-Sprachcodes
D.5.6 ISO-3166-Ländercodes
D.5.7 Zeichensatz ISO-Latin-1
D.5.8 Sonderzeichen
D.6 XML-1.0-Regeln

20 Transformation von XML in WML und HTML

Persönliche mobile Kommunikations-Endgeräte werden verwendet, die mit einer Bandbreiten-Informationsrate von mehr als 10 Mb/s arbeiten und die Multimedia-Dienstleistungen empfangen können.FussnoteDiese These aus der Delphi-Studie 1998 wird nach Meinung der Befragten bis ca. 2005/2006 Realität werden.

Delphi'98

Bislang ist es bei XSLT beziehungsweise den Transformationen (fast) immer um das Ergebnis HTML gegangen. In diesem Kapitel soll es außerdem um ein anderes Zielformat gehen: die Wireless Markup Language (WML), in der Dokumente abgefaßt sein müssen, die von einem Handy oder Personal Digital Assistant (PDA) abgerufen werden können. Solche Daten kann man auf einem normalen Webserver wie dem Apache bereithalten; er muss lediglich ein paar neue MIME-Typen kennen, das heißt, die Datei mime.types im Konfigurationsverzeichnis des Apache muss die folgenden Zeilen beinhalten, damit der Server die WML-Daten ausliefern kann:

text/vnd.wap.wml                wml
application/vnd.wap.wmlc        wmlc
text/vnd.wap.wmlscript          wmls
application/vnd.wap.wmlscriptc  wmlsc
      

Das s in den Endungen steht für Scripts, das c für eine kompilierte Datei. Für den Apache bedeutet dies, dass er wie gewohnt die Daten über HTTP ausliefert; erst das WAP-Gateway nimmt den Protokollwechsel vor.

WML ist anders als HTML. Aber es ist wie dessen Neudefinition (siehe Kapitel 19) eine XML-Anwendung. Das heißt unter anderem, wer WML schreibt oder, wie in diesem Fall, generiert, muss die üblichen XML-Vorgaben beachten: ordentliches Schachteln et cetera. Wer nicht selbst schreibt, sondern WML aus XML generiert, muss sich darüber keine Gedanken machen, weil XSLT und Tools wie XT und Saxon falsches Schachteln anmahnen. WML-Dokumente haben einen Dokumenttyp, dessen offizielle Definition auf dem Server des WAP-Forums liegtFussnoteMöglicherweise ändert sich das irgendwann, denn das WAP-Forum und das W3C arbeiten gemeinsam an einer neuen Version von WML. Die Beteiligten beim W3C stellen sich das WML der Zukunft als eine Teilmenge des kürzlich verabschiedeten XHTML vor..

Ausgangspunkt für die Beschäftigung mit WML beziehungsweise WAP war die Tatsache, dass einer der Autoren innerhalb der iX-Redaktion für die CeBIT 2000 eine WML-Demonstration vorbereitet hat, bei der XML eine tragende Rolle spielte.FussnoteAn dieser Stelle sei Jürgen Seeger, dem iX-Chefredakteur, gedankt, weil er nicht nur die Genehmigung dazu gegeben hat, die Quellen hier zu verwenden, sondern auch wesentlichen Anteil am Fortschritt und Debugging des XSLT-Codes hatte.

Natürlich sollte die CeBIT-Demonstration kein Selbstzweck sein, sondern eine tatsächliche Anwendungsmöglichkeit darstellen. Dazu sollten die Daten, die anlässlich eines kleinen Sonderheftes schon vorhanden waren, sowohl in HTML als auch in WML gewandelt online zur Verfügung stehen. Es handelte sich um eine Liste von Ausstellern zu bestimmten Themen, wie Application Server, Bluetooth oder Java, die man über das Web oder über das Handy leichter finden können sollte.

Basis für die Online-Dateien waren zwei Relationen in einer Datenbank: eine, in der die Firmen stehen, und eine, die die CeBIT-Daten beinhaltete. Man hätte sicherlich direkt aus dem DBMS über eine Reihe Reports HTML und WML erzeugen könen, aber wie dieses Kapitel zeigen wird, ist die Lösung, auf XML aufzubauen, variabler. Dies aus zwei Gründen: erstens, weil sich aus dem Zwischenformat XML viele Zielformate erzeugen lassen; und zweitens ermöglicht es ein Programm wie Saxon, beliebig viele Dateien über ein einziges Stylesheet zu generieren. Dementsprechend ging es zunächst darum, eine XML-Basisdatei zu generieren, aus der über XSLT unterschiedliche Sichten erzeugt werden sollten.

Vorsicht!

WML-Dateien dürfen nicht allzu groß sein, damit der Speicher eines Handys nicht überlastet wird. Es war also von vornherein darauf zu achten, die resultierenden Dateien möglichst klein zu halten. Wir gingen nach Gesprächen mit Experten davon aus, dass es auf keinen Fall mehr als 3000 Zeichen sein dürfen.

Jede WML-Einheit ist ein Deck (englisch für einen Kartenstapel). Inkonsequenterweise heißt das Top-Level-Element aber nicht deck, sondern wml. Konsequenterweise heißen die einzelnen Karten card. Innerhalb dieser ist eine HTML nicht unähnliche Syntax vorgesehen, wie das Ergebnis der Transformation zeigtFussnoteVorgezogen ist das Listing an dieser Stelle, weil wir das Stylesheet noch gar nicht behandelt haben :-). Damit Sie einen Einblick bekommen, wie solch eine WML-Datei aussieht, wollen wir Ihnen ein Listing in dieser Auszeichnungssprache nicht länger vorenthalten. Die hier wiedergegebene Datei wap4.wml ist eine von circa 100, die mit dem später folgenden XSLT-Stylesheet erzeugt wird:

<?xml version="1.0" encoding="utf-8" ?>

<!DOCTYPE wml
  PUBLIC "-//WAPFORUM//DTD WML 1.1//EN" 
         "http://www.wapforum.org/DTD/wml_1.1.xml">
<wml xmlns="http://www.wapforum.org/DTD/wml_1.1.xml">
   <template>
      <do type="options" label="Top">
         <go href="index.wml"/>
      </do>
   </template>
   <card id="wap1" title="WAP">
      <p>
         <strong>Comma Soft AG</strong>
         <br/>Halle     4, Stand A61<br/>Produkt: 
           helpLINE W@PDesk - WAP-Anbindung fuer 
           CallCenter und   Hotlines</p>
      <do type="accept" label="Next">
         <go href="#wap2"/>
      </do>
      <do type="prev" label="Prev">
         <go href="wap3.wml#wap5"/>
      </do>
   </card>

<!-- hier fehlen drei weitere Firmen, wie sich an den
     Verweisen auf die nächste Firma nachvollziehen lässt -->

   <card id="wap5" title="WAP">
      <p>
         <strong>Danet IS GmbH</strong>
         <br/>Halle     6, Stand C18, 
              Mitaussteller bei Intershop<br/>Produkt: 
              Distribution Nokia WAP-Server, WAP-Projekte</p>
      <do type="accept" label="Next">
         <go href="wap5.wml"/>
      </do>
      <do type="prev" label="Prev">
         <go href="#wap4"/>
      </do>
   </card>
</wml>
          

Auffallend ist am Anfang der doppelte Eintrag des System-Bezeichner für die DTD, einmal einleitend aber noch einmal als Namensraumbezeichner im Top-Level-Element. Das war Saxon leider nicht abzugewöhnen. Ebenfalls auffallend (zumindest in Mitteleuropa), dass der Zeichensatz nicht ISO-8859-1 ist. Das erwies sich insofern als unproblematisch, weil nicht alle Handys mit solchen encoding-Anweisungen etwas anzufangen wussten, sodass es erforderlich war, in einer kleinen Nachbearbeitung Details wie die Zeichensatzkodierung und den Namensraumbezeichner bei WML herauszufischen. Aus demselben Grund (nicht alle Handys sind gleich) war es auch nötig, auf Umlaute zu verzichten.

Herunter 20.1 Erzeugen der WML-Dateien
Herunter 20.2 Erzeugen der HTML-Dateien

Valid HTML 4.01!Valid CSS!