Arbeit, Arbeit —, ich bitte, gleich wird er mich einen Feind der Menschheit schelten, einen inimicus humanae naturae, wenn ich es wage, an Zeiten zu erinnern, wo er mit dieser Fanfare den gewohnten Effekt durchaus nicht erzielt hätte, nämlich an Zeiten, wo das Gegenteil seines Ideals in unvergleichlich höheren Ehren standDas Zitat stammt aus dem
Zauberberg. Sprecher ist Naphta in einem der Gespräche mit Settembrini..Thomas Mann
Selten hat etwas so deutlich gezeigt, dass Informatiker
gern spielen, wie das World Wide WebDass das nicht nur
für Informatiker gilt, ist ein unbestätigtes Gerücht. Gemeint
ist damit, dass spielerische Web-Seiten und viele bunte Bilder
allerorten anzutreffen sind. Gemeint ist aber auch, dass
kostenlos erhältliche Software im Web zeigt, dass
der scheinbar ziellose Spieltrieb oft genug Nützliches
bringt.. Was das
Spiel
für Implikationen hat, wird
sich erst in ein paar Jahren zeigen, wenn jemand untersucht, was
sich an Informationen in Web-Dokumenten angesammelt hat —
und wofür das gut ist oder sein kann. Hier sei ein
Miniaturbeispiel dessen gegeben, was — natürlich mit den
Mitteln der Extensible Markup Language — ohne großen
Aufwand möglich ist, wenn es darum geht, strukturierte Daten in
Form von HTML im Web zur Verfügung zu stellen. Ein kleines und
nachvollziehbares Anwendungsbeispiel inklusive Konvertierung von
XML nach HTML soll die Möglichkeiten,
die in XML stecken, demonstrieren — als Datenformat
und als Basis für die Aufbereitung für das Web. In diesem Fall soll
das XML-Dokument tatsächlich eine Datei sein, die
Angaben über Autoren der Weltliteratur enthält — ohne dass
die Angaben erst aus einer Datenbank generiert werden. Das Ziel ist
es, neben einem Inhaltsverzeichnis sehen zu können, welche
Autoren in einem bestimmten Jahrhundert gelebt haben, wie ihre
Werke heißen, wer an einem konkreten Tag Geburtstag hat respektive
gestorben ist (Kalender) und möglicherweise mehr. Hier kann
natürlich nicht alles dargestellt werden.
Im Vergleich zum Buch selbst als XML-Anwendung, wie es das vorige Kapitel thematisiert hat, handelt es sich hier um eine andere Art der Gliederung. Nicht erst das gesamte Dokument bildet ein Ganzes, sondern es umfasst bereits eine Vielzahl kleiner, in sich abgeschlossener Einheiten, eben die Autoren. Zwar sind auch Kapitel für sich lesbar, aber sie sind nicht so unabhängig von der Struktur eines Buches wie Autoreneinträge im Vergleich zur gesamten Literaturgeschichte.
Der Grund dafür, die Daten in einer einzigen Datei zu
halten, war einzig und allein BequemlichkeitNicht
ganz, es lag zum Teil auch daran: Unter
XML-Anhängern geistert der Traum eines universellen
Datenformats (nicht proprietär) umher, das weltweiten
Informationsaustausch zwischen unterschiedlichen Anwendungen
möglich macht. Ein Beispiel: Im kommerziellen Bereich existiert
eine XML-EDI-Arbeitsgruppe, die sich um den
Austausch von Geschäftsdaten auf XML-Ebene
bemüht. Solche Daten können selbstverständlich aus Datenbanken
kommen; sie werden es im Normalfall auch
tun.. Derselbe Grund könnte eines Tages
für eine Datenbank sprechen. An die Arbeit mit
dem Emacs gewöhnt, fällt es leicht, das
Editieren per Hand und mit Hilfe des Emacs-Modes
(PSGML) vorzunehmen. So lassen sich
DTD, XML und Style Sheet quasi
gleichzeitig bearbeiten und überprüfen
Um den
Glaubenskrieg um den einzig wahren xyz-Editor gleich wieder
zu beenden: Der eigentliche Grund ist das Vorhandensein des
Emacs auf den Rechnern der Autoren und der relative Komfort des
PSGML-Mode. Er erlaubt es, sich an beliebiger
Stelle im Dokument die möglichen Elemente zeigen zu
lassen, Elementnamen zu verändern etc... Dass es
eine Reihe weiterer für SGML geeigneter Editoren
gibt, wollen wir nicht verschweigen. Sie finden sie auf
Robin Covers
Webseite unter dem Stichwort Software.
Für wen eine solche Anwendung überhaupt sinnvoll ist,
sei hier gar nicht erst diskutiertDoch: Zwischen Ernst
und Spielerei angesiedelt zeigt sie, wenn sie weiter mit Inhalt
gefüllt wird, einen Teil der Literaturgeschichte, in dem sich
blättern lässt.. Sie ist klein genug, um im Rahmen
dieses Buches halbwegs umfassend dargestellt zu werden, und
sie kann wachsen, so dass sie später eine mittelgroße Anwendung sein
könnte. Unter http://www.mintert.com/xml/ ist der
aktuelle URL dieser kleinen Literaturgeschichte zu
finden.
Im Wesentlichen gibt es bei einer solch kleinen Anwendung vier Phasen beziehungsweise bedenkenswerte Aspekte:
Im Grunde ist die erste der Fragen bereits beantwortet worden: Einzelne Autoren, Jahrhunderte etc. sollten sich anzeigen lassen. Die zweite Frage ist insofern wesentlich komplizierter, als die Daten so gehalten sein müssen, dass die Struktur (das betrifft implizit auch die dritte Frage) erweiterbar ist. So sahen etwa die ersten Versionen von XML-Daten und DTD die Einbeziehung des Nobelpreises nicht vor. Auch ein Bild war zunächst nicht enthalten. Aber eins nach dem anderen.