In here, thi trik is thinkin rite. Thas all u 1/2 2 do. U 1/2 2 think rite. U 1/2 2 b dairing & koshis, u 1/2 2 b ver sensibil & totily mad. Moast ov ol u 1/2 2 b cluvir, u 1/2 2 b ingenius. U 1/2 2 b abil 2 use whatevir is aroun u, & thass whot it reely cums doun 2; [...] so iss up 2 u reely what yoos u make ov it aftir that; iss ol about injinooty [...]Diese Sprache ist nicht wirklich übersetzbar, aber wenigstens ein Versuch in einem Deutsch, das dem Original nacheifert, muss sein: Hia drin is der Trik: richtich denkn. Das alles, wassu machn muss. Dumus richtich denkn. Mus waagemuutich un voorsichtich sein, mus seer sänsibel und völich verük sein. Vor allem mussu klewwa sein — und ährfinnungsreich. Du mus als nuzn könn, was um dich rum soda ist, das eintlich als; [...] is dein Bier, wassu damit anfengs; als nua Finnungsgeiß [...]
Iain M. Banks
So schwer verständlich wie dieses Motto, das einem
britischen Science-Fiction-RomanEr heißt Feersum
Endjinn, stammt aus dem Jahre 1994 und enthält auch
Passagen in
normalem
Englisch. entnommen
ist, auf den ersten Blick wirkt, wird sich die Lektüre dieses
Buches — hoffentlich — nicht gestalten. Denn wer
dieses Buch liest, weiß aller Wahrscheinlichkeit nach zumindest, was
die Hypertext Markup Language ist
beziehungsweise wofür das Kürzel HTML
steht.
Im günstigen Fall haben potenzielle
LeserinnenDass es sich auch um männliche Vertreter
dieser Gattung handeln darf, versteht sich von
selbst. schon einmal selbst Hand an eine
HTML-Datei gelegt, entweder mit einem
WYSIWYG-Werkzeug oder gar im
Quelltext. Letzteres wäre insofern eine ideale Voraussetzung,
als dieses Buch naturgemäß viele Beispiele enthält, die in keinem
WYSIWYG-Editor zu sehen sind, da es
sich um Quelltexte handelt. Viele davon sind mit
etwas HTML-Kenntnissen lesbar. Selbst die
Beschreibungen von Dokumentstrukturen, die
Dokumenttyp-Definitionen (DTD),
mit denen man sich in HTML nie herumschlagen muss,
sind so leicht verdaulich wie handelsübliche Prosa
Hier
sei dahingestellt, ob die DTD-Prosa eher
Trivialliteratur oder Thomas Manns Zauberberg
entspricht; letzteres wäre natürlich mehr als
anmaßend.. In jedem Fall wollen wir lieber eine
Erläuterung zu viel als eine zu wenig vorsehen. Und das fängt bei
den drei Buchstaben XML an.
Die Extensible Markup Language, wie
diese neue Sprache bei aufgelöstem Akronym heißt, ist nicht als
Ersatz für HTML gedacht — das zur Beruhigung
aller, die die Web-Auszeichnungssprache gerade gelernt
haben. Sie ist mehr als HTML, weil sie erlaubt,
etwas zu tun, das man bislang im Web nur mit zusätzlichen
Werkzeugen — und in geringem Umfang — tun konnte:
beliebige Elemente verwendenGemeint ist hier, dass
einige Werkzeuge dem festen Satz an HTML-Elementen
neue hinzufügen, die vor der Ausgabe an den Browser ein Programm
wandeln beziehungsweise bearbeiten. Als Beispiel sei das Element
gtext genannt, das nur der
Web-Server Roxen kennt und der so markierten Text als grafische
Zeichen ausgibt.. In der Objektorientierung hieße das
Äquivalent abstrakte Datentypen (selbst
geschaffene, wie Person et cetera, im Gegensatz zu den
vorgegebenen, wie
int
oder char
), und diese
beliebigen Elemente werden sich als roter Faden durch das
gesamte Buch ziehen.
Um an dieser Stelle noch nicht allzu tief in XML einzudringen, sei nur ein winziges Beispiel angeführt: In HTML gibt es die — und nur die — in der HTML-DTD vorgesehenen Elemente wie H1 oder BLOCKQUOTE. In XML dagegen kann sich jede(r) beliebig viele eigene Elemente definieren: von REZEPT über URLAUBSERINNERUNG bis hin zu STRASSE, etwa in einem privaten Adressbuch.
So enthielte eine Beschreibung der Struktur (d.i. die oben
genannte Dokumenttyp-Definition) für ein Adressbuch
wahrscheinlich außer einem Element wie ADRESSBUCH (das das gesamte Dokument
einschließt, wie das Element HTML in
Web-Dokumenten) weitere Elemente wie VORWAHL, TELNR und PLZ, die innerhalb einer ADRESSEADRESSBUCH wäre hier gewissermaßen die
Bezeichnung für die Art des Dokuments, wohingegen die
einzelnen Adressen dessen Inhalt bilden. Genauer: Ein
Adressbuch enthält beliebig viele Adressen, diese wiederum Namen
und Straßenbezeichnungen et cetera. hierarchisch
geschachtelt wären (und sein müssen).
HTML ist mittlerweile eine recht
komplizierte Sprache geworden. Version 4
[ragg98]
[ragg98]HTML 4 - Web-Publishing mit dem neuen HTML-Standard
- Web-Publishing mit dem neuen HTML-Standard, Dave Raggett, Jenny Lam, Ian Alexander, Michael Kmiec, Bonn, 1998, Addison-Wesley beinhaltet
wesentlich mehr, als Tim Berners-Lee sich Ende der achtziger,
Anfang der neunziger Jahre hätte träumen lassen. Dennoch hat
HTML gewisse Grenzen. Da ist zum einen der eingeschränkte
Vorrat an Elementtypen (von HTML
selbst bis zu P und EM), zum anderen besteht die Gefahr, dass der
vielbeschworene Standard allmählich auseinander driftet. Dem war
natürlich etwas entgegenzusetzen. Womit wir bei
XML sind — und ob respektive wie dieser neue
Standard dieses Auseinandertreiben verhindern kann.
Hinter fremden Dingen kann sich Spaß verbergen. Das oben zitierte
Motto steht hier unter anderem dafür — und natürlich hat
es inhaltlich mit dem zu tun, was in diesem und den nächsten
Kapiteln folgt. Denn angemessenes (Nach-)Denken (thinkin
rite
) kann bei beliebig tief strukturierten Dokumenten
— um die geht es schließlich — nicht verkehrt sein;
vor allem dann, wenn sie (auf unterschiedliche Weise) beim Leser
beziehungsweise Surfer ankommen sollen.
Um das Motto noch ein wenig zu strapazieren: Ein
Dokument bedeutet das, was diejenigen, die es verfassen (und
diejenigen, die es rezipieren), darin lesen wollen beziehungsweise
können. Erfindungsreichtum (injinooty
) ist gefragt. Das
hat mit dem Thema dieses Buches insofern viel zu tun, als die
Extensible Markup Language (XML)
andere Fähigkeiten erfordert als die bisherige Sprache des Web
(HTML). Neben dem reinen Markup
kommen eine formale Beschreibung der Dokumentstruktur
sowie Formatvorgaben für die Ausgabe im Web und
anderswo hinzu. Formatvorgaben kennen Sie vielleicht über die
Cascading Style Sheets (CSS) in
HTML.
In Kleinbetrieben etwa dürfte die Strukturbeschreibung des Dokuments (eine Dokumenttyp-Definition) entweder jemand außer Haus erledigen, oder der bisherige HTML-Autor muss anfangen, sich damit zu beschäftigen, wie man derlei zu Wege bringt. In Kapitel 13 ist dazu Einführendes zu lesen.
Bevor es ins Detail geht, soll ein Schaubild den Zusammenhang, in dem sich das Folgende bewegt, deutlich machen. Unten stehende Abbildung zeigt, dass auf der linken Seite SGML, XML und HTML in eine Reihe gehören.
XML ist eine Teilmenge von SGML. Für beide gilt, dass DSSSL-Stylesheets auf sie anwendbar sind. XML-Daten lassen sich allerdings auch in Verbindung mit CSS, Level 2, anzeigen. HTML schließlich ist eine SGML-Anwendung, eine Dokumenttyp-Definition. Mit ein paar Veränderungen hat das World Wide Web Consortium (W3C) Anfang 2000 HTML als eine Anwendung von XML umgesetzt. Das heißt, das Konsortium hat HTML in XML (statt SGML) neu definiert. Nur für HTML waren ursprünglich die Cascading Style Sheets gedacht, die sich jetzt auch auf XHTML anwenden lassen.
XSL schließlich soll die Stilsprache für
XML werden; sie entspricht von den Funktionen her
der Online-Variante von DSSSL —
beziehungsweise die Tools, die XSL
sprechen
, werden diese Eigenschaften dem Anwender zur
Verfügung stellen. Dabei handelt es sich erstens um die
Formatierobjekte (XSL-FO), die aus
XML-Dokumenten zum Beispiel Adobes Portable
Document Format (PDF) erzeugen, und zweitens die
Transformationen (XSLT), die es ermöglichen,
XML-Dokumente von einer Struktur in eine andere
zu wandeln (beispielsweise ein Adresssbuch in
HTML).