Die wesentliche Idee von SGML, nämlich das Konzept des
generic coding
, ist bereits fast dreißig Jahre alt.
William Tunnicliffe von der Graphic Communications
Association (GCA) machte im September 1967 den
Vorschlag, den Informationsgehalt eines Dokumentes von
seiner äußeren Form zu trennen. Ebenfalls Ende der
sechziger Jahre veröffentlichte Stanley Rice, ein New
Yorker Buch-Designer, seine Idee der editorial
structure tags
, woraus später das generic
markup
entstand. Der Begriff des markup
stammt aus dem
Verlagswesen, aus einer Zeit, als Begriffe wie Desktop-Publishing noch unbekannt waren.
Nach der inhaltlichen Überprüfung und
Korrektur eines Manuskriptes folgte die Bearbeitung
durch den Layouter, der die Entscheidungen über
Seitenformat, Zeichensätze und weitere typografische
Festlegungen traf. Diese wurden in Form von
handschriftlichen Markierungen und Anweisungen in das
Manuskript eingefügt und anschließend im Satz
berücksichtigt.
Eine genaue Umsetzung dieser Vorgehensweise spiegelte sich dann auch in elektronischen Dokumenten wider. Texte enthielten Steuerzeichen oder Makros, die Anweisungen für die Formatierung gaben. Als später der Trend begann, in den Büros Schreibmaschinen durch Computer zu ersetzen, lebte dieses Konzept fort. Noch heute arbeiten die gängigen Textverarbeitungen nach diesem Prinzip. Zwar stellen die modernen WYSIWYG-Programme die Steuerzeichen nicht mehr auf dem Bildschirm dar, sondern können dank grafischer Oberflächen Attribute wie Fettdruck, Unterstreichungen und verschiedene Zeichensätze unmittelbar anzeigen, die Fixierung auf das Layout des Dokuments herrscht jedoch noch immer vor.
Um so erstaunlicher, dass die Idee des Generic Coding
schon so alt ist. Im Gegensatz zum formatorientierten
Ansatz geht es beim Generic Coding darum, die Struktur
und die logischen Elemente eines Dokuments zu
kennzeichnen. Diese Art der Information geht bei der
üblichen Vorgehensweise verloren. Setzt ein Verfasser
eine Überschrift in einer größeren Schriftart, so kann
ein Leser diesen Text durchaus als Überschrift
erkennen, der Computer weiß
jedoch nichts davon. Das
Dokument enthält in diesem Fall nur die Information,
wie ein Text darzustellen ist, aber nicht, welche
Funktion er erfüllen soll.
Genau hier setzt das Generic Coding an. Markierungen
sagen etwas über die Art (generic, englisch: artmäßig)
der markierten Stelle aus. Die Art
bezeichnet hier
zum Beispiel ein Kapitel, eine Überschrift, einen hervorgehobenen
Text, eine Fußnote, einen Eigennamen, ein Zitat und so weiter. Die
Vorteile liegen auf der Hand. Die Struktur des
Dokuments geht bei der Speicherung nicht verloren. Die
Zuordnung einer bestimmten Darstellung zu einer
bestimmten Klasse von Textstellen ist
anwendungsspezifisch eindeutig möglich: Bei einem
Ausdruck etwa hätten alle Überschriften die gleiche
Schriftart und -größe, bei einer Ausgabe über einen
Sprachsynthesizer immer den Hinweis Titel
.
Das waren die ursprünglichen Ideen von Tunnicliffe
und Rice. Die Bedeutung dieser Ideen erkannte Norman Scharpf, Direktor der GCA. Er gründete ein Komitee,
dessen Entwicklung des GenCode
-Konzepts später
Bedeutung für SGML erlangte.
Ebenfalls auf den Ideen von Tunnicliffe und Rice
basierend, entwickelten Charles Goldfarb, Edward Mosher und Raymond Lorie bei IBM
im Jahre 1969 die
Generalized Markup Language (GML). GML enthielt
erstmals das Konzept eines formal definierten
Dokumenttyps mit einer verschachtelten Struktur. Nach
der Fertigstellung von GML formulierte Goldfarb
weitere Konzepte, die zwar nicht in GML, aber später
in SGML Einzug hieltenDamit sollte klar sein,
was der Scherz in der FAQ der Newsgruppe comp.text.sgml
bedeutet:
Was heißt SGML?
Antwort: Standard
Goldfarb Mosher Lorie..
Die Entwicklung zu einem Standard begann 1978, als das American National Standard Institute (ANSI) ein Komitee gründete, dessen Ziel die Entwicklung einer standardisierten Textbeschreibungssprache auf GML-Basis war. Goldfarb war Mitglied dieser Gruppe, die auch vom GCA-GenCode-Komitee Unterstützung erhielt. Nach mehreren Normentwürfen fand 1984 eine Neuorganisation des Projekts unter Leitung des ANSI und inzwischen auch der International Organization for Standardization (ISO) statt. Die zuständige Arbeitsgruppe der ISO unter Leitung von James Mason vom Oak Ridge National Laboratory rief regelmäßige Treffen ins Leben. Parallel dazu arbeitete das ANSI-Komitee, geleitet von William Davis (SGML Associates), immer noch unterstützt vom GenCode-Komitee, dessen Leiter Sharon Adler von IBM war. Die Abstimmung zwischen ISO und ANSI lag in den Händen von Charles Goldfarb.
Ein letzter Entwurf für den internationalen Standard
wurde im Oktober 1985 präsentiert. Nach einem
weiteren Jahr, in dem man Anregungen und Kommentare
einarbeitete, gipfelte die Arbeit 1986 in der
Veröffentlichung der Standard Generalized Markup
Language als ISO-Standard 8879Weitere Informationen zur
geschichtlichen Entwicklung von SGML sind in
[gold90]
[gold90]
The SGML Handbook
, Charles F. Goldfarb, 1990, Oxford University Press und
[gold97]
[gold97]The SGML History Niche
, Charles F. Goldfarb, 1997, http://www.sgmlsource.com/history/index.htm zu
finden..