XMLidP2000

Sitemap

Sitemap

1 Einführung
1.1 Warum mehr weniger ist
1.2 Warum mehr mehr ist
1.3 Wohin die Reise geht
2 Was sind Dokumente?
2.1 Eine kurze Geschichte der Textverarbeitung
2.2 Bestandteile eines Dokumentes
2.3 Die neue, alte Idee: Strukturorientiert schreiben
2.4 Die Entwicklung des Hypertextes
2.5 Textformate im Web
2.6 Das SGML-Konzept: Generic Markup
2.7 Dokumente versus Daten
3 XML im Web
3.1 XML bei der Verwaltung von Websites
3.2 Clientseitige XML-Interpretation
3.2.1 XML mit CSS
3.2.2 XML mit XSL(T)
3.3 XML auf dem Server
3.4 Linking-Möglichkeiten von XML
3.5 XML als Datenaustauschformat
4 XML Quick Start
4.1 Dokumenttyp-Definition (DTD) und Instanzen
4.2 Verarbeitung der Dokumente
4.2.1 Beispiel: Verarbeitung mit Cost/TCL
4.2.2 Beispiel: Verarbeitung mit XSLT
4.2.3 Beispiel: XML/XSLT im Internet Explorer
4.2.4 Fazit
5 XML-DTDs: Die verständliche Beschreibung
5.1 Ein Wort zur Notation
5.2 Dokumente
5.3 Elemente
5.4 Zeichen, Namen und Zeichendaten
5.5 Kommentare
5.6 Processing Instructions
5.7 Wo bleibt Multimedia?
5.8 Dokumenttyp-Definition (DTD)
5.8.1 Elementtyp-Deklaration
5.8.2 Attributlisten-Deklaration
5.8.3 Möglichkeiten, die DTD zu gestalten und zu gliedern
5.8.4 Notation-Deklaration
6 Namensräume in XML
7 XPath: Adressierung von XML-Dokumentteilen
7.1 Zu Grunde liegendes Datenmodell
7.2 Zugriff auf den Datenbaum
7.3 Hilfe von Operatoren
7.4 Kernfunktionen für den Datenzugriff
8 XML: Linking
8.1 Notwendige Begriffe
8.2 XLink: einfache und erweiterte Links
8.2.1 Einfache Verweise
8.2.2 Erweiterte Links
8.2.3 XLink in der Praxis
8.3 XPointer: Verweise in Dokumente hinein
8.3.1 XPath-Erweiterungen in XPointer
9 Überblick über Stylesheet-Sprachen
9.1 Cascading Style Sheets
9.1.1 Wertzuweisungen
9.1.2 Formatierungsmodell
9.1.3 CSS und XML
9.1.4 Ein Beispiel: XML im Mozilla
9.2 Document Style Semantics and Specification Language
9.2.1 Flow Objects
9.2.2 Verarbeitungs-Modus
9.2.3 DSSSL praktisch
9.2.4 Langer Marsch von DSSSL nach HTML
9.3 Extensible Stylesheet Language (XSLT und XSL)
9.3.1 Verhältnis von XSLT zu XSL
9.3.2 Formatierung mit XSL
10 XSL-Transformationen
10.1 Grundsätzliches über Templates
10.2 Ergänzungen zum Datenmodell von XPath
10.3 Struktur von XSLT-Stylesheets
10.4 Den Ergebnisbaum erzeugen
10.4.1 Diverse Basiselemente
10.4.2 Formatierte Nummerierung
10.4.3 Schleifen und bedingte Verarbeitung
10.4.4 Sortieren
10.4.5 Variable und Parameter
10.4.6 Zusätzliche Funktionen
10.4.7 XSLT-Erweiterungen
10.4.8 message, output
11 XSLT in Web-Anwendungen
11.1 XSLT im Internet Explorer
11.2 Linklisten erzeugen
11.3 Details einer Literaturgeschichte
11.3.1 Sortierte Überblicksseiten
11.3.2 Kalender: einzelne Tage ausgeben
12 XML-Editoren
12.1 Übersicht
12.1.1 Emacs + PSGML (mit XML-Unterstützung)
12.1.2 XML Notepad
12.1.3 XML Spy
12.1.4 XMetal
12.1.5 Epic
12.1.6 MarkupKit (für MS Word)
12.1.7 WordPerfect Office2000
12.2 Emacs und PSGML (mit XML-Unterstützung)
12.3 XML-Notepad
12.4 XML Spy
12.5 XMetal
12.6 Epic
12.7 MarkupKit (für MS Word)
12.8 WordPerfect Office2000
12.9 Fazit
13 Entwicklung einer DTD
13.1 Auswahl einer Mehrzweck-DTD
13.2 Entwurf einer DTD
13.2.1 Dokumentanalyse
13.2.2 Tipps und Tricks
13.3 Instanzen ohne DTD
14 Herstellung dieses Buches
14.1 Zielsetzung und Randbedingungen
14.2 Definition der DTD
14.2.1 Schritt 1: Die Grobstruktur
14.2.2 Schritt 2: Elemente auf Zeichenebene
14.2.3 Schritt 3: Die Details
14.3 Formatieren des Manuskriptes
14.3.1 Konvertierung in HTML
14.3.2 Aufbereitung für den Ausdruck
14.4 Erfahrungen mit der zweiten Auflage
15 Anwendungsbeispiel Literatur
15.1 Vorüberlegungen
15.2 En détail: die Autoren in der DTD
15.3 Wie die Daten ins Web gelangen
15.3.1 Inhaltsverzeichnis generieren
15.3.2 Ausgabe der Autorendaten
15.4 Vollständige Listings
15.4.1 DTD für die Literaturgeschichte
15.4.2 DSSSL-Listing: Inhaltsverzeichnis
15.4.3 DSSSL-Listing: Ausgabe eines einzelnen Autors
15.4.4 Perl-Code für Ausgabe einzelner Autoren
16 Verteilte Softwareverwaltung mit XML
16.1 Aufgabenbeschreibung
16.2 XML als Datenbasis
16.3 Bilden von DTD-Hierarchien
16.4 Zusammentragen von verteilten XML-Fragmenten
16.5 Fazit
16.6 Stylesheet zur Transformation in HTML
17 E-Commerce mit XML
17.1 B2B-E-Commerce
17.1.1 Die Rolle von XML
17.1.2 Technische Aspekte
17.2 BMEcat
17.3 Electronic Business XML (ebXML)
17.3.1 Arbeitsgruppen
17.3.2 Zeitplan des Projekts
17.4 XML und EDIFACT
18 XML und Apache
18.1 XML-Transformation per CGI
18.1.1 Konfiguration des Servers
18.1.2 CGI-Skript: xmlhandler.cgi
18.1.3 Beispiel: von HTML nach HTML mit DSSSL oder XSLT
18.2 Cocoon
18.2.1 Extensible Server Pages (XSP)
18.2.2 Beispiel: Formatierung in PDF mit XSL
18.2.3 Beispiel: Simuliertes XLink mit Dynamic HTML/JavaScript
18.2.4 Installation
19 XHTML: Neues HTML 4 — erweiterbar
19.1 Status quo: HTML neu definiert
19.2 Modulare Zukunft
20 Transformation von XML in WML und HTML
20.1 Erzeugen der WML-Dateien
20.2 Erzeugen der HTML-Dateien
21 Ausblick
21.1 XML Schema
21.2 Programmierung mit XML-Daten
21.3 XML und Java
21.4 Resource Description Framework
21.5 Die Zukunft
A Extensible Markup Language (XML) 1.0
A.1 Einleitung
A.1.1 Herkunft und Ziele
A.1.2 Terminologie
A.2 Dokumente
A.2.1 Wohlgeformte XML-Dokumente
A.2.2 Zeichen
A.2.3 Allgemeine syntaktische Konstrukte
A.2.4 Zeichendaten und Markup
A.2.5 Kommentare
A.2.6 Processing Instructions
A.2.7 CDATA-Abschnitte
A.2.8 Prolog und Dokumenttyp-Deklaration
A.2.9 Standalone-Dokumentdeklaration
A.2.10 Behandlung von Leerraum
A.2.11 Behandlung des Zeilenendes
A.2.12 Identifikation der Sprache
A.3 Logische Strukturen
A.3.1 Start-Tags, End-Tags und Leeres-Element-Tags
A.3.2 Elementtyp-Deklarationen
A.3.3 Attributlisten-Deklaration
A.3.4 Bedingte Abschnitte
A.4 Physikalische Strukturen
A.4.1 Zeichen- und Entity-Referenzen
A.4.2 Entity-Deklarationen
A.4.3 Analysierte Entities
A.4.4 Behandlung von Entities und Referenzen durch einen XML-Prozessor
A.4.5 Konstruktion des Ersetzungstextes von internen Entities
A.4.6 Vordefinierte Entities
A.4.7 Notation-Deklarationen
A.4.8 Dokument-Entity
A.5 Konformität
A.5.1 Validierende und nicht-validierende Prozessoren
A.5.2 Benutzen von XML-Prozessoren
A.6 Notation
A.7 Anhang A: Referenzen
A.7.1 Normative Referenzen
A.7.2 Weitere Referenzen
A.8 Anhang B: Zeichenklassen
A.9 Anhang C: XML und SGML (nicht normativ)
A.10 Anhang D: Expansion von Entity- und Zeichenreferenzen (nicht normativ)
A.11 Anhang E: Deterministische Inhaltsmodelle (nicht normativ)
A.12 Anhang F: Automatische Erkennung von Zeichenkodierungen (nicht normativ)
A.13 Anhang G: XML-Arbeitsgruppe des W3C (nicht normativ)
B Verknüpfen von Style Sheets mit XML-Dokumenten Version 1.0
B.1 Die xml-stylesheet-Processing-Instruction
B.2 Anhang A: Referenzen
B.3 Anhang B: Begründung
C Verhältnis von XML zu SGML und HTML
C.1 XML und SGML
C.2 XML und HTML
D Übersichten
D.1 Cascading Style Sheets
D.1.1 CSS-Eigenschaften und -Werte
D.1.2 CSS-Muster
D.2 DSSSL: Flow Objects
D.3 Syntax der XSLT-Elemente
D.4 DTD-Fragment für XSLT-Stylesheets (nicht normativ)
D.5 Relevante Spezifikationen und Organisationen
D.5.1 International Organization for Standardization
D.5.2 World Wide Web Consortium
D.5.3 Organization for the Advancement of Structured Information Standards
D.5.4 Internet Society und Internet Engineering Task Force
D.5.5 ISO-639-Sprachcodes
D.5.6 ISO-3166-Ländercodes
D.5.7 Zeichensatz ISO-Latin-1
D.5.8 Sonderzeichen
D.6 XML-1.0-Regeln

2.4 Die Entwicklung des Hypertextes

Some of them were dreamers
Some of them were fools
Who were making plans and thinking of the future

Jackson Browne

Der zweite große Entwicklungsstrang, der in das Web mündete, begann noch ein paar Jahre früher als die ersten Generic-Markup-Ideen. Die Rede ist vom Hypertext. Älteste Beispiele von Texten, die Querverweise nutzen, datieren einige Jahrhunderte zurück. DeRose und Durand zeigen zum Beispiel einen Druck von Euklids Elementen aus dem 17. Jahrhundert [dedu94] [dedu94]Making Hypermedia Work - A User's Guide to Hytime - A User's Guide to Hytime, Stephen DeRose, David G. Durand, 1994, Kluwer Academic Press, in dem Verknüpfungen von Textstellen durch Verweise realisiert sind. Die Protagonisten unseres Jahrhunderts sahen im Hypertext stets mehr als nur eine Form von Verweisen.

Urvater aller Hypertextsysteme: Memex

Als Vorläufer oder zumindest als Inspiration der modernen Hypertextsysteme gilt Vannevar Bushs fiktives System Memex. Seinen vielzitierten Artikel As we may think veröffentlichte er bereits im Jahre 1945. Darin skizziert er ein System, das man sich äußerlich als Schreibtisch (vielleicht mit eingebautem Desktop-Computer) vorstellen kann. Selbstverständlich ist noch nicht die Rede von Mikroprozessoren und Festplatten. Seine technologische Grundlage ist die (Mikro-)Fotografie. Wesentlich ist aber, dass Memex mit einzelnen Informationseinheiten (vorstellbar als einzelne Seiten eines Hypertextes) arbeitet, die der Benutzer durch Wege (trails) miteinander verbinden kann (heute: Hyperlinks). Bush zeichnet ein sehr feines Bild der Anwendungen, die ihm vorschweben. Die visionäre Kraft dieses vorausschauenden Artikels macht den Text auch nach mehr als 50 Jahren lesenswertFussnoteIm Oktober 1995 fand anläßlich des fünfzigsten Jubiläums von Bushs Artikel eine Feier am Massachusetts Institute of Technology statt. Dabei ging es auch darum, herauszufinden, What Has Been Accomplished, and What Remains to Be Done. Zu den Rednern gehörten Douglas Engelbart, Theodor Nelson und Tim Berners-Lee; außerdem auch Douglas Adams, Autor zahlreicher Science-Fiction-Romane. Informationen zu dieser Veranstaltung sind im Web unter http://www-eecs.mit.edu/AY95-96/events/bush/ zu finden..

Einige Stationen der Hypertext-Entwicklung

Abbildung 5: Einige Stationen der Hypertext-Entwicklung

Douglas Engelbart bezieht sich in der ersten Veröffentlichung zu seinem Augment-Projekt ebenfalls auf Bush. Engelbart beschreibt hier im Jahre 1962 (in Augmenting Human Intellect [enge62] [enge62]Augmenting Human Intellect - A Conceptual Framework - A Conceptual Framework, Douglas C. Engelbart, 1962, http://www.histech.rwth-aachen.de/www/quellen/engelbart/ahi62index.html) eine auf Lochkarten basierende Hypertext-Anwendung, die das Ziel hat, Gedankengänge abzubilden:

There was no convenient way to link these cards together so that the train of thought could later be recalled by extracting the ordered series of notecards. An associative-trail scheme similar to that out lined by Bush for his Memex could conceivably be implemented with these cards to meet this need and add a valuable new symbol-structuring process to the system. [...]
Suppose that one wants to link Card B to Card A, to make a trail from A to B. He puts Card B into a slot so that the edge-notched coding of the card's serial number can automatically be sensed, and slips Card A under a hole-punching head which duplicates the serial-number code of Card B in the coding of the holes punched in a specific zone on Card A. Later, when he may have discovered Card A, and wishes to follow this particular associative trail to the next card, he aligns that zone on Card A under a hole-sensing head which reads the serial number for Card B therein and automatically sets up the sorting mechanism. A very quick and simple human process thus initiates the automatic extraction of the next item on the associative trail. It's not unreasonable to assume that establishing a link would take about three seconds, and tracing a link to the next card about three to five seconds.
What I Do:
I build paradigms.
I work on complex ideas and make up words for them.
It is the only way.

Ted Nelson prägt den Begriff Hypertext.

Den Begriff Hypertext prägte ein Mann namens Ted Nelson. Seine Historie beginnt im Jahre 1960, als er begann, sich Gedanken über Hypertext zu machen [xana97] [xana97]Xanadu FAQ, Xanadu Australia, 1997, http://www.xanadu.com.au/xanadu/faq.html. Die erste Veröffentlichung erschien im Jahre 1965, drei Jahre nachdem Douglas Engelbart seine erste Schrift zu Augment vorstellte. Nelsons System XanaduFussnoteSiehe http://www.xanadu.net/ hat eine bewegte, mehr als dreißigjährige Geschichte hinter sich, von der Gary Wolfs Artikel in Wired berichtetFussnoteWir wollen nicht verschweigen, dass dieser Artikel außerordentlich negativ aufgenommen wurde. Nelson selbst nennt ihn böswillig (maliciously) und Raggett et al. sprechen in [ragg97] [ragg97]HTML 3.2 - Neue Möglichkeiten für das Web-Publishing - Neue Möglichkeiten für das Web-Publishing, Dave Raggett, Jenny Lam, Ian Alexander, Bonn, 1997, Addison-Wesley von offenen Beschimpfungen, mit denen Wired [Nelson] bedacht hat. Machen Sie sich selbst ein Bild! [wolf95] [wolf95]Gary Wolf, The Curse of Xanadu, Wired, 6, 1995, http://www.hotwired.com/wired/3.06/features/xanadu.html. Die Ideen und Visionen, die bereits in den 60er Jahren im Xanadu-Projekt formuliert wurden, gehen weit über das hinaus, was bis heute im Web realisiert ist. Es ist überraschend, dass Nelsons Visionen über Jahrzehnte so geringen Anklang gefunden haben und nun in kürzester Zeit eine schlechte Kopie Wirklichkeit wurde. Dass er selbst die Entwicklung mit zwiespältigen Gefühlen betrachtet, ist verständlich. So kann er in [ragg97] [ragg97]HTML 3.2 - Neue Möglichkeiten für das Web-Publishing - Neue Möglichkeiten für das Web-Publishing, Dave Raggett, Jenny Lam, Ian Alexander, Bonn, 1997, Addison-Wesley zwar noch eine besser als nichts-Aussage abgeben,

Endlich gibt es ein populistisches, anarchisches elektronisches Publishing in Netzwerken.
Das World Wide Web ist wie Karaoke: Jeder kann es, ohne es geübt zu haben, und das ist das Großartige daran.
,

aber auf einer seiner Webseiten [nels96] [nels96]Xanadu and OSMIC, Theodor Nelson, 1996, http://www.sfc.keio.ac.jp/~ted/xanadu.and.osmic.html liest sich das schon weniger positiv:

Many people think Xanadu was an attempt to build the World Wide Web. On the contrary: the World Wide Web was exactly what we were trying to prevent.

In [conn97] [conn97]XML: Principles, Tools and Techniques, Dan Connolly, Sebastopol/CA, 1997, O'Reilly stellt er die SGML-Grundlage des Web, Embedded Markup, in FrageFussnoteMan beachte, dass es darum geht, dass die Auszeichnungen in den Inhalt eingebettet (embedded) sind. Es geht nicht um Generic Markup oder die Bevorzugung des layoutorientierten Ansatzes; Nelson nennt neben SGML ausdrücklich RTF, was ebenfalls eingebettete Auszeichungen enthält, die jedoch die Formatierung betreffen. Insofern richtet sich seine Kritik gegen alle bekannten Textsysteme.. Der Titel seines Aufsatzes lautet Embedded markup considered harmful [nels97] [nels97]Theodor Nelson, Embedded markup considered harmful , in [conn97] [conn97]XML: Principles, Tools and Techniques, Dan Connolly, Sebastopol/CA, 1997, O'Reilly.

Seine bisherigen revolutionären Ansätze und visionären Gedanken verbieten, seine Kritik einfach zu ignorieren. Vielmehr könnte es viel Zeit und Geld sparen, sich vor Entwicklung einer neuen Technologie ein paar Gedanken darüber zu machen. So sind aktuelle Probleme des Web, wie zum Beispiel das Urheberrechtsproblem, von Nelson schon durchdacht worden. Wie er schon vor 30 Jahren die Begriffe Hypertext und Hypermedia prägte, so spricht er heute von Transcopyright und Transpublishing. Es bleibt abzuwarten, wann wir seine Terminologie so selbstverständlich benutzen, wie wir es mit Hypertext heute machen.

Neben allem Lob für Nelsons Visionen muss man aber auch sehen, dass die Revolution des Web keine technische Revolution war. Aus technischer Sicht war es eher ein kleiner Schritt. Vielleicht kommt es auf die gute Kombination an: das Machbare machen und das Wünschenswerte nicht aus den Augen verlieren.

Aus neuerer Zeit ist noch eine ISO-Norm zu erwähnen. Im Jahre 1992 wurde HyTime, die Hypermedia/Time-based Structuring Language verabschiedet. Sie hatte auch große Bedeutung für die neuen Linking-Konzepte XLink und XPointer.

Eine stilgerechte Zusammenfassung der Hypertext-Entwicklung bietet Stefan Münz in [muen97] [muen97]Hypertext v 1.2, Stefan Münz, 1997, http://www.teamone.de/hypertext/. Selbstverständlich beschränkt sich Münz nicht auf die historischen Meilensteine, sondern sagt auch etwas über das Web. Das tun wir nun auch.

Valid HTML 4.01!Valid CSS!