HTML (3.2, 4.0) ist eine SGML Anwendung
XML ist der Standart für erweiterbares Markup
HTML muss in XML reformuliert werden
Version 1.0, W3C Proposed Recommendation August 1999
HTML 4.01 enthält die notwendigen Anpassungen
am 26. Januar 2000 W3C Recommendation
XHTML Dokumente sind XML konform.
Sie können mit XML Tools bearbeitet werden.
XHTML Dokumente können als text/html
von HTML 4.0 Browsern verwendet werden.
XHTML Dokumente können aber auch als text/xml
oder als application/xml
(mit geeigneten Style Sheets)
verwendet werden.
XHTML Dokumente können mit DOM bzw. XML-DOM verwendet werden, d.h. mit (Java)Scripts und Applets.
XHTML Dokumente verschiedener Autoren (Systeme, Umgebungen) werden besser zusammenpassen als HTML Dokumente.
Da XHTML eine XML Anwendung ist, können neue Markup-Elemente einfach hinzugefügt werden.
XHTML ist nicht mehr nur auf Browser beschränkt. Viele andere User-Agents (Handys, Sprachausgabe, etc.) werden damit umgehen können (best effort content transformation).
Sie müssen entsprechend einer XHTML DTD gültige (valid) XML Dokumente sein.
Das Root-Element muss <html>
sein.
Das Root-Element muss einen gültigen XHTML Namensraum bestimmen, der ein gültiger XML Namensraum sein muss.
Es muss eine XML DOCTYPE
Deklaration vor dem
Root-Element verhanden sein.
Die Internet Medien Typen (Mime Types) dürfen
text/html
, text/xml
oder application/xml
sein.
<?xml version="1.0"?> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/strict.dtd"> <html xmlns="http://www.w3.org/TR/xhtml1"> <head> <title>Browser Titel</title> </head> <body> <h1>Dokument Titel</h1> <p> Ein Paragraph <br /> auf zwei Zeilen. </p> <math xmlns="http://www.w3.org/TR/REC-MathML"> ... Text in MathML ... </math> </body> </html>
XHTML Dokumente müssen well-formed sein, d.h. gültige Schachtelungsstruktur haben.
<p>Paragraph <em>Hervorhebung</em></p> statt <p>Paragraph <em>Hervorhebung</p><em>
Element- und Attribut-Namen müssen in Kleinbuchstaben geschrieben sein.
<li> statt <LI>
End-Tags müssen immer vorhanden sein
(falls nicht per XML das Element als EMPTY
deklariert wurde).
<p>Paragraph</p> <p> weiterer Paragraph</p> statt <p>Paragraph <p> weiterer Paragraph
Bei leeren Elementen ohne End-Tag muss das Start-Tag mit
"/>
" beendet werden.
<br />
Attributwerte müssen in Anführungszeichen eingeschlossen werden. Auch bei Zahlenwerten.
<img ... width="300" /> statt <img ... width=300 />
Attributwerte müssen immer angegeben werden.
<dl compact="compact" > statt <dl compact >
In Attributwerten wird Whitespace auf jeweils ein Blank verkürzt, bzw. am Beginn und Ende von Zeichenketten abgeschnitten.
alt=" Beschreibung eines Bildes " wird zu alt="Beschreibung eines Bildes"
Script-Texte müssen als CDATA
markiert werden,
falls sie < oder & enthalten.
<script> <![CDATA[ ... Inhalt des Scripts ]]> </script>
SGML Ausschluss-Definitionen sind nur informell festgelegt.
z.B. das a-Element darf kein weiteres a-Element enthalten.
Das name
Attribut von HTML muss als
XML id
Attribut angegeben werden.
<a name="section1" id="section1" ... >
© Universität Mannheim, Rechenzentrum, 1998-2000.
Heinz Kredel Last modified: Thu May 4 22:07:44 MEST 2000