XML in der Praxis - Beispiel: von HTML nach HTML mit DSSSL oder XSLT

18.1.3 Beispiel: von HTML nach HTML mit DSSSL oder XSLT

Das Ausgangsdokument ist ein HTML-Dokument gemäß HTML-4-strict-DTD (oder XHTML 1.0). Die Ansicht im Browser zeigt Abbildung 65.

Abbildung 65: Vorher: HTML-Darstellung im Browser

Etwas schmucklos ist das Beispiel schon. Das wird sich nun ändern. Um die Behandlung als XML-Dokument zu aktivieren, erhält die Datei nun die Endung .xml. Wie oben beschrieben tritt dann der xmlhandler in Aktion. Selbstverständlich wird noch ein Stylesheet benötigt. Im XML-Dokument wird das mit einer der beiden folgenden Zeilen eingebunden:

<!-- die DSSSL-Variante -->
<?stylesheet href="htmltoc.dsl" type="text/dsssl"?>
<html>
...


<!-- die XSLT-Variante -->
<?xml-stylesheet href="htmltoc.xsl" type="text/xsl"?>
<html>
...

Lädt der Browser jetzt die identische Datei mit der .xml-Endung, so erscheint im Browser die Ansicht aus Abbildung 66.

Abbildung 66: Nachher: serverseitig mit DSSSL oder XSLT aufbereitetes HTML

Hier hat die zuvor so farblose HTML-Seite nicht nur ein paar optische Veränderungen erfahren, sondern auch eine neue Überschrift bekommen, die aus dem title-Element entnommen wurde, sowie ein Inhaltsverzeichnis, das selbstverständlich verlinkt ist. Dieses Verzeichnis setzt sich aus den h1-Überschriften der HTML-Datei zusammen. Um es nochmals zu betonen: An der HTML-Datei wurden keine Änderungen vorgenommen. Einzig das Stylesheet (wahlweise DSSSL oder XSLT) hat die Transformation ausgeführt. Für beide Stylesheet-Sprachen sind in den folgenden Listings Implementierungen für die Generierung des Inhaltsverzeichnisses zu finden. Zunächst das Stylesheet in DSSSL programmiert:

<!DOCTYPE style-sheet PUBLIC "-//James Clark//DTD DSSSL Style Sheet//EN">

<![CDATA[
;
; © Stefan Mintert
;

(declare-flow-object-class element
  "UNREGISTERED::James Clark//Flow Object Class::element")
(declare-flow-object-class empty-element
  "UNREGISTERED::James Clark//Flow Object Class::empty-element")
(declare-flow-object-class entity-ref
  "UNREGISTERED::James Clark//Flow Object Class::entity-ref")
(declare-flow-object-class document-type
  "UNREGISTERED::James Clark//Flow Object Class::document-type")
(declare-characteristic preserve-sdata?
  "UNREGISTERED::James Clark//Characteristic::preserve-sdata?"
  #t)
(declare-flow-object-class formatting-instruction
  "UNREGISTERED::James Clark//Flow Object Class::formatting-instruction")
(declare-flow-object-class processing-instruction
  "UNREGISTERED::James Clark//Flow Object Class::processing-instruction")


(define read-entity
  (external-procedure "UNREGISTERED::James Clark//Procedure::read-entity"))


;
; Funktion zum Kopieren der Attribute definieren
;
(define (copy-attributes #!optional (nd (current-node)))
  (let loop ((atts (named-node-list-names (attributes nd))))
    (if (null? atts)
        '()
        (let* ((name (car atts))
               (value (attribute-string name nd)))
          (if value
              (cons (list name value)
                    (loop (cdr atts)))
              (loop (cdr atts)))))))


;
; Default-Regel: Elemente kopieren
;
(default (make element
               attributes: (copy-attributes)))


;
; Funktion zur Ermittlung des TITLE
;
(define (get-doctitle)
  (data 
   (node-list-map (lambda (snl)
                    (if (string=? (gi snl) "TITLE")
                        snl
                        (empty-node-list)))
                  (children (children (ancestor "HTML"))))))
                  ; Kinder von HTML sind HEAD und BODY,
                  ; ein Kind von HEAD ist TITLE

;
; Wurzelelement ausgeben
;
(element html
  (make element gi: "html"
          (process-children)))

;
; Kopf inkl. Stylesheet-LINK ausgeben
;
(element head
  (make sequence
    (make empty-element gi: "link"
          attributes: (attribute (list "rel" "stylesheet" 
                                       "type" "text/css" 
                                       "href" "http://www.mintert.com/css/std.css" 
                                       "title" "Style Sheet for mintert.com")))
    (process-children)))



;
; Im Rumpf: Ueberschrift aus dem TITLE erzeugen und
; Inhaltsverzeichnis einfuegen; abschliessend ADDRESS
; ausgeben
;
(element body
  (make element gi: "body"
    attributes: (copy-attributes)
    (make sequence
      (make element gi: "h1"
            (literal (get-doctitle)))
      (make element gi: "h2"
            (literal "Inhaltsverzeichnis"))
      (make element gi: "ol"
            (with-mode inhalt (process-children)))
      (hr)
      (process-children) ; Kind-Elemente aus dem Rumpf kopieren
      (hr)
      (make element
        gi: "address"
        (literal "© Stefan Mintert")))))

;
; =========== Modus Inhalt
; IHV inkl. Links auf die Ueberschriften erzeugen
;
(mode inhalt
  (element h1
    (make element gi: "li"
      (make element gi: "a"
            attributes: (attribute 
                             (list 
                               "href" 
                               (string-append 
                                "#" 
                                (number->string
                                 (child-number))))
                              )
            (literal (data (current-node))))))

  (default 
    (process-node-list 
     (select-elements 
      (descendants  (current-node)) 
      "h1")))

)


;
; =========== normaler Modus
; Erzeuge Name-Anker fuer H1-Ueberschriften
;
(element h1
  (make element gi: "h1"
    (make element gi: "a"
          attributes: (attribute
                           (list 
                             "name" 
                              (number->string
                               (child-number)))
                           )
          (make sequence
            (literal (number->string (element-number)))
            (literal ". ")
            (process-children)))))


;
; HR durch Funktion (hr) ausgeben lassen
;
(element hr
  (hr))





; ----------------------------------------------------------------------

;
; Definiere hr-Funktion zur Ausgabe einer
; horizontalen Linie
;
(define (hr)
  (make empty-element gi: "hr"
        attributes: (attribute (list "noshade" "noshade" "size" "1"))))

;
; Hilfsfunktion zur Ausgabe einer Attlist
;
(define (attribute aliste)
  (if (null? aliste)
      (list)
      (cons (list (car aliste) (car (cdr aliste)))
            (attribute (cdr (cdr aliste))))))



]]>

Es folgt die Implementierung in XSLT:

<?xml version="1.0" encoding="ISO-8859-1"?>
<xsl:stylesheet 
        xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
        xmlns="http://www.w3.org/TR/REC-html40"
        result-ns="">


<!-- © Stefan Mintert -->


<!-- Default: Kopieren der Elemente; PIs werden ignoriert -->

<xsl:template match="*|@*|comment()|text()">
 <xsl:copy>
  <xsl:apply-templates select="*|@*|comment()|text()"/>
 </xsl:copy>
</xsl:template>

<!-- ____________________________________________________ -->



<!-- Kopf inkl. Stylesheet-LINK ausgeben -->

<xsl:template match="head">
  <head>
    <link rel="stylesheet" 
             type="text/css" 
             href="http://www.mintert.com/Css/std.css" 
             title="Style Sheet for mintert.com" />

  <xsl:apply-templates/>
  </head>
</xsl:template>



<!--
  Im Rumpf: Ueberschrift aus dem TITLE erzeugen und
  Inhaltsverzeichnis einfuegen; abschliessend ADDRESS
  ausgeben
-->

<xsl:template match="body">
 <body>
 <h1><xsl:value-of select="from-ancestors(html)/from-children(head)/from-children(title)/text()"/></h1>

  <ol>
      <xsl:for-each select="h1">
        <li><a>
         <xsl:attribute name="href">
          <xsl:text>#</xsl:text>
          <xsl:number level="any" count="h1"/>
         </xsl:attribute><xsl:apply-templates/>
        </a></li>
      </xsl:for-each>
  </ol>

 <hr size="1" noshade="noshade" />

 <!-- Kind-Elemente aus dem Rumpf kopieren: -->
 <xsl:apply-templates/>

 <hr noshade="noshade" size="1" /><address>© Stefan Mintert</address>

 </body>
</xsl:template>

<!-- ____________________________________________________ -->


<!-- Erzeuge Name-Anker fuer H1-Ueberschriften -->

<xsl:template match="h1">

 <h1><a>
    <xsl:attribute name="name">
      <xsl:number level="any" count="h1"/>
    </xsl:attribute>
    <xsl:number level="any" count="h1"/>
    <xsl:text>. </xsl:text>
    <xsl:apply-templates select="*|@*|comment()|pi()|text()"/>
  </a></h1>
</xsl:template>

Zu den Vorteilen der serverseitigen Transformation gehört, dass die Browser nur HTML beherrschen müssen. Außerdem kann für jeden Browsertyp eine besondere Ausgabe erzeugt werden. Selbstverständlich lassen sich statt HTML auch WML-Daten generieren, die für ein WML-fähiges Mobiltelefon geeignet sind. Durch die Implementierung mit dem CGI-Skript stehen dem Webmaster alle technischen Wege offen. Die hier vorgestellten Verfahren per DSSSL bzw. XSL(T) sind nicht die einzigen denkbaren. Auch Stylesheets in Perl, Python oder Tcl sind möglich, je nach Präferenzen des Programmierers. Über Parameter, die wie üblich als ?var1=wert1&var2=wert2... an den URL angehängt werden, lässt sich das CGI-Skript bei Bedarf steuern. Zum Beispiel könnte ?format=RTF anzeigen, dass das Ergebnis nicht HTML sondern RTF sein soll (Jade beherrscht die Ausgabeformate RTF, MIF und TeX). Die beschriebene Realisierung sollte in dieser oder einer ähnlichen Form mit jedem (CGI-fähigen) Server funktionieren. Wer sich auf den Apache festgelegt hat, die CGI-Programmierung scheut und sich für XSL(T) als Stylesheet-Sprache entscheidet, der kann mit weniger Aufwand und einem neuen Produkt XML servieren.

Sitemap

18.1.3 Beispiel: von HTML nach HTML mit DSSSL oder XSLT