Wenn Sie HTML-Daten mit XML-Programmen einsetzen möchten, haben Sie zwei Möglichkeiten: wohlgeformte HTML-Instanzen (ohne DTD) oder gültige HTML-Instanzen (mit DTD).
In beiden Fällen dürfen End-Tags nicht mehr weggelassen werden (OMITTAG NO), und die Schreibweise von Namen (etwa von Elementen) muss konsistent sein; es darf kein Wechsel zwischen Klein- und Großschreibung stattfinden (NAMECASE GENERAL NO). Die SGML-Deklaration für HTML enthält an diesen Stellen den Wert YES. Abweichungen gibt es des Weiteren bei leeren Elementen und bei Processing Instructions. XML sieht hierfür NET "/>" bzw. PIC "?>" vor. Processing Instructions spielen in der HTML-Praxis keine Rolle, und ob ein spezieller Browser Probleme mit leeren Elementen der Form <img .../> hat, käme auf einen Versuch an (was in der Praxis wegen der großen Zahl der Browser unmöglich ist).
Wer HTML-Dokumente als besondere Form von XML-Dokumenten verarbeiten möchte, sollte auf XHTML mit der eigens definierten DTD umsteigen. Die Spezifikation des W3C enthält im Anhang C einige Richtlinien für diesen Fall (http://www.w3.org/TR/xhtml1/).