Einleitung
XML Sprachkonstrukte
XML Helfer
Stand und Ausblick
HTML
SGML
XML
eXtensible
Markup
Language
W3C Recommendation,
10. Feb. 1998
von SGML, TEI, HTML Leuten
Basis für viele Dinge
nicht erweiterbar
nur einfache Struktur
keine Validierung
HTML Beispiel (1)
<HTML> <HEAD> <TITLE>Beispiel </TITLE> </HEAD> <BODY> <H1>Überschrift</H1> <P>Ein Paragraph mit Text ...</P> </BODY> </HTML>
HTML Beispiel (2)
<UL> <LI>Eine ungeordnete <LI>Liste <LI>it verschiedenen <LI>Punkten </UL>
total Erweiterbar
komplexe Struktur
strenge Validierung
Spezifikation: 200+ Seiten
XML Spezifikation: 40 Seiten
SGML Beispiel (1)
<!ELEMENT COMPANY - - (NAME?,PRODUCT?) > <!ELEMENT NAME - O (#PCDATA)> <!ELEMENT PRODUCT - - (ITEM*)> <!ELEMENT ITEM - O (#PCDATA)> <!ENTITY ... > <!ATTLIST COMPANY type (non-profit | limited | corp) >
SGML Beispiel (2)
<COMPANY type=corp > <NAME>All you want <PRODUCT> <ITEM>Apartments <ITEM>Automobiles <ITEM>... </PRODUCT> </COMPANY>
Teilmenge von SGML
einfache Spezifikation
offener Standard
HTML ähnlich
International, Unicode
Syntax Prüfbar
Validierbar
erweiterbar
effizient
schon Verfügbar
MS IE, Netscape
verbesserte Links, XLL
Style Sheets, XSL
kein Ersatz für SGML
kein Ersatz für HTML
Beispiel: .xml .dtd
<p secret="false">This sentence is in the content of an element whose type is "p"; the content is found between the start-tag and the end-tag. The paragraph has an attribute named "secret" whose value is "false". <IMG SRC="icon.jpg"/> is an empty element, distinguished by the fact that it ends with "/>".</p>
<!doctype book SYSTEM "book.dtd" [<!entity toc SYSTEM "toc.xml"> <!entity chap1 SYSTEM "d/c1.xml"> ]> <book> <head>&toc;</head> <body> &chap1; &chap2; </body></book>
<!doctype eg [<!entity xml "Extensible Markup Language"> ]>
<eg>The new &xml; standard is fully internationalized; the following are all examples of the digit "1": 1 (in ASCII), ١ (in Devanagari), १ (in Arabic), and ൧ (in Malayalam).</eg>
XML-Namespace,
Namensräume
XLink, XML Linking Language,
Verweise aus XML Dokumenten heraus
XPointer, XML Pointer Language,
Zeiger in XML Dokumente hinein
XPath, XML Path Language,
Wird in XSLT und XPointer benötigt,
Zeichenketten die einen bestimten Teil
eines XML Dokuments bezeichnen
XSL, Extensible Stylesheet Language
Stildefinitionen
XSLT, XSL Transformatons
XML Stiltransformationen
XML Schema: Structures, Datatypes
Bedingungen (Constraints) für Dokumentstrukturen und Datentypen
Document Type Definition
"wellformed" XML Dokumente
geht ohne DTD
"valid" XML Dokumente
nur bezüglich einer DTD
Referenz per URI oder Inline
XML verlangt korrekte Schachtelung der Elemente
leere Elemente sind speziell gekennzeichnet
nur ein einziges "root" Element
Attributwerte in Quotes
Entities brauchen eine DTD
Elementnamen sind Case-sensitiv
White-Space im Inhalt ist relevant
mehrere Zeichensätze sind verwendbar
es gibt nur wenige reservierte Zeichen
XML Deklaration
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
Deklaration des Dokumenttyps
<!doctype book SYSTEM fileurl > <!doctype memo [ ... ] > <!doctype html PUBLIC bezeichner url >
Dokument-Instanz
<book> <head> ... </head> <body> ... </body> </book>
Elemente
<!ELEMENT name Inhalt > <name> ... </name>
Attribute
<!ATTLIST element AttName AttTyp Default > <element AttName="wert" >
Entities
<!ENTITY name wert > &name;
Character Data, CDATA
<![CDATA[ dies ist kein <tag/> ]]>
Parsed Character Data, PCDATA
Mischung aus CDATA und Elementen
Anweisungen, Processing Instructions
<?PHP ... ?>
Kommentare
<!-- ... -->
Leerraum, White-Space
ist im Inhalt signifikant
Folgen
(from, to, subject, message, signature)
Auswahl
(para|list|image)
Wiederholungsoperatoren
+
einmal oder mehr
*
nullmal oder mehr
?
nullmal oder einmal
beliebiger Inhalt
(#PCDATA)
beliebige Zusammensetzungen
(head, (p|list|image)*, div+, (#PCDATA|em|strong))
leeres Element
EMPTY
beliebiges Element
ANY
Attribut Typ
CDATA
Zeichenketten
ID
Bezeichner
IDREF
Verweis auf Bezeichner
IDREFS
Folge von IDREF
ENTITY
ENTITIES
Folge von ENTITYs
NMTOKEN
NMTOKENS
Folge von NMTOKENs
ENUMERATION
Aufzählung von Werten
NOTATION
Festlegung von Wertformaten
(EN|FR|GR)
Enumeration, Aufzählung
Attribut Default
#IMPLIED
wird von der Anwendung erkannt
#REQUIRED
muss angegeben werden
#FIXED wert
fester Wert
wert
Defaultwert
Beispiel
jahr #FIXED "2000" lang (EN|FR|GR) "EN" bez #ID #IMPLIED href #CDATA #REQUIRED
Beschreibung des Dokumententyps
<?xml encoding="US-ASCII"?> <!ELEMENT personals (person)+> <!ELEMENT person (name,email*,url*,link?)> <!ATTLIST person id ID #REQUIRED> <!ELEMENT family (#PCDATA)> <!ELEMENT given (#PCDATA)> <!ELEMENT name (#PCDATA|family|given)*> <!ELEMENT email (#PCDATA)> <!ELEMENT url EMPTY> <!ATTLIST url href CDATA #REQUIRED> <!ELEMENT link EMPTY> <!ATTLIST link manager IDREF #IMPLIED subordinates IDREFS #IMPLIED>
XML Dokument entsprechend dieser DTD
<?xml version="1.0"?> <!DOCTYPE personals SYSTEM "personal.dtd"> <personals> ... <person id="K.TAMURA"> <name> <family>TAMURA</family> <given>Kent</given> </name> <!-- This URL is mail address.--> <url href="mailto:kent@trl.ibm.co.jp"/> <url href="mailto:tkent@jp.ibm.com"/> <link manager="H.MARUYAMA"/> </person> </personals>
Erleichtert die Verwendung verschiedener DTDs im gleichen Dokument.
Vordefinierte Namensräume
xml
immer auf w3c/XML/namespace
und xmlns
immer leer
Default Namespace xmlns="..."
Definierte Namespaces xmlns:spec="..."
Definition von spec
,
xsl
und html
:
<X xmlns:spec="http://www.w3.org/specpath/" > <spec:tag ...> ... </spec:tag> </X>
<xml:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:html="http://www.w3.org/TR/REC-html40/" >
Verwendung
<em> ... </em> <latex:em> ... </latex:em> <HTML:A HREF="...">Beschreibung</HTML:A> <person HTML:href="..."> ... </person>
Am Anfang XLL, jetzt aufgeteilt in XLink und XPointer. Stand Dezember 1999.
Verweise zwischen mehreren 'Resourcen'. Metadaten für Verweise. Eignung für Link-Datenbanken.
Auswahl des Namensraums für XLink
xmlns:xlink="http://www.w3.org/1999/xlink/namespace/"
Definition durch Attribut
<A xlink:type="simple" ... >oder Element
<xlink:simple href="..." ... > Inhalt </xlink:simple>
mögliche Typen sind
simple
wie A in HTML
extended
erweitert, volles XLink
locator
nur externer Verweis
arc
Mit Hinweisen über die Richtung von Links
resource
lokaler Verweis
title
nur zur Beschreibung
Locator Attribut, Verweis
xlink:href="connector"
Verbinder, Connectors
URI#XPointer
Client kümmert sich um Auflösung
URI|Xpointer
Server kümmert sich um Auflösung
URI?CGI-Parameter
Anwendung
<L xmlns:xlink="http://www.w3.org/1999/xlink/namespace/" xlink:type="simple" xlink:href="http://host/path/doc.html#xyz" > text </L>
Verhaltensattribute von Links
xlink:show="..."
Anzeigeverhalten
new
Anzeige in neuem Fenster
replace
Anzeige im aktuellen Fenster
embed
Einfügen in das aktuelle Fenster
xlink:actuate="..."
Aktivierungsverhalten
onLoad
automatische Anzeige
onRequest
Anzeige nur nach Benutzerwunsch
xlink:from="NMTOKEN"
xlink:to="NMTOKEN"
Beschreibung der Verlinkung bei arc
Verwendung zusammen mit xlink:role
xlink:role="NMTOKEN"
freie Zusatzinformationen, maschinenverwendbar
xlink:title="CDATA"
freie Zusatzinformationen für Menschen verwendbar
simple |
extended |
locator |
arc |
resource |
title |
|
---|---|---|---|---|---|---|
type
|
X | X | X | X | X | X |
href
|
X | X | ||||
role
|
X | X | X | X | ||
title
|
X | X | X | X | ||
show
|
X | X | X | |||
actuate
|
X | X | X | |||
from
|
X | |||||
to
|
X |
<X xlink:type="extended" > <L xlink:type="locator" ROLE="TR" TITLE="Übersetzung" SHOW="NEW" HREF="/cgi-bin/xlate?term=Verweis" /> <L xlink:type="locator" ROLE="Kontext" TITLE="Links im Kontext" SHOW="REPLACE" HREF="link-spec.html#verweis" /> <L xlink:type="locator" ROLE="Bild" TITLE="Links in Bildern" SHOW="EMBED" HREF="bild.gif" /> <L xlink:type="locator" ROLE="Tutorium" TITLE="Link Tutorium" SHOW="NEW" HREF="xml-tut.html#ID(def-link)..DITTO,NEXT(3,P)" /> Verweise </X>
mit der DTD
<!ELEMENT X (#PCDATA|L)* > <!ELEMENT L EMPTY > <!ATTLIST X xlink:type CDATA #FIXED "extended" > <!ATTLIST L xlink:type CDATA #FIXED "locator" >
erzeugt (abhängig vom UA) u.U. folgendes Menue
- Übersetztung - Links im Kontext - Links in Bildern - Link Tutorium
<!ELEMENT A (#PCDATA) > <!ATTLIST A xmlns:xlink="http://www.w3.org/1999/xlink/namespace/" > <!ATTLIST A xlink:type "simple" > <!ATTLIST A xlink:href CDATA #REQUIRED > <!ATTLIST A xlink:show "replace" > <!ATTLIST A xlink:actuate "onRequest" >
Noch starke Veränderungen in den Working Drafts des W3C.
Verweise auf Teile/Parts von XML Dokumenten (als Baum von Knoten betrachtet). Identifikation von Parts durch Vergleich von Zeichenketten.
Wird in XSLT und XPointer zur Spezifikation von Fragmenten verwendet. Diese definieren auch den Kontext in dem die XPath Ausdrücke ausgewertet werden.
Aufbau eines Pfadbestandteils
achse::knotentest[prädikat]
Beispiel
child::para[position()=7] http:://host/pfad/resource#xpointer(child::para[position()=7])
Komposition von Pfaden durch Pfadbestandteile, die durch
/
getrennt werden.
Achsen (axis): definieren Folgen von Kandidaten zur Auswahl
Prädikate (predicates): Boolesche Bedingungen zur Einschränkung der Auswahl
Funktionen: generieren von (neuen) Kandidaten zur Auswahl
child
Kindknoten des aktuellen Knotens
descendent
Nachfahren
parent
Elternknoten
ancestor
Vorfahren
preceding
Vorgänger Knoten
following
Nachfolger Knoten
preceding-sibling
Vorgänger Geschwister-Knoten
following-sibling
Nachfolger Geschwister-Knoten
attribute
Attributknoten
namespace
Namensraum-Knoten
self
der Knoten selbst
descendant-or-self
ancestor-or-self
ancestor
, descendant
,
following
, preceding
und self
Partitionieren die Menge aller Knoten eines Dokuments.
achse::*
zur Selektion aller Knoten
achse::name
zur Selektion bestimmter Elemente
oder Attribute
achse::funktion()
zur Selektion von Knoten mit
bestimmten Eigenschaften.
Beispiel: alle para
Element-Knoten
child::para
Beispiel: das href
Attribut des Knotens
attribute::href
Beispiel: alle Textknoten
child::text()
[ test-ausdruck ]
Selektiert Knoten, für die die Auswertung des Test-Ausdrucks
"wahr" ergibt
Ausdrucksbedeutung von axis::node[test]
ist (axis::node)[test]
und nicht axis::(node[test])
der Test-Ausdruck darf arithmetische (+, -, *, div, mod)
und boolesche (or, and, !, <, >, <=, >=, =, !=)
Operatoren enthalten.
Schreibweise: <
für <
Beispiel: der 7. Knoten
[ position() = 7 ]
last()
Position des letzten Elements
position()
aktuelle Position des Elements
count(node-set)
Anzahl der Elemente
id(object)
Element, das durch Objekt Identifiziert wird
name(node-set)
Name der Selektion
string(object)
Konvertiert das Objekt in Zeichenkette
concat(string1, string2 ,...)
Zeichenketten Verbindung
starts-with(string1, string2)
contains(string1, string2)
substring(string, position, length)
string-length(string)
translate(string1, string2, string3)
boolean(object)
not(boolean)
number(object)
round(number)
Zur Vereinfachung gibt es eine ganze Reihe von kompakteren Bezeichungen der Pfadbestandteile.
para
für child::para
*
für child::*
text()
für child::text()
@href
für attribute::href
@*
für attribute::*
[ 7 ]
für *::*[position()=7]
chapter//para
für child::chapter/descendant::para
chapter/section
für child::chapter/child::section
//
für /descendant-or-self::node()/
Verweise auf Teile/Fragmente von XML Dokumenten. Fragmente sind einzelne Punkte/Objekte/Knoten und zusammenhängende Bereiche von Punkten. Identifikation von Fragmenten durch Vergleich von Zeichenketten.
Steht in enger Beziehung zu DOM. Baut auf XPath auf. Wird zusammen mit XLink zur Definition von XML Links benötigt.
URL Aufbau mit XPointer
service:://host/pfad/resource#xpointer-expr
service:://host/pfad/resource|xpointer-expr
dabei ist xpointer-expr
:
html-name
oder xpointer( xpath-expr )
oder xpointer( xpath-expr to xpath-expr )
Beispiele
#intro #xpointer(id("intro")) #xpointer(//*[@id="intro"])
neue Typen
point
(ein Knoten oder ein Zeichen einer Zeichenkette)
und range
( begin-expr to
end-expr )
und einige dazu gehörige Funktionen,
z.B. point()
und range(...)
.
Beispiele
xpointer( id("sec2.1")/descendant::P[last()] to id("sec2.2")/descendant::P[first()] )
Am Anfang XSL, jetzt aufgeteilt in XSL Transformations (XSLT) und XSL Formating (FO).
wesentlich mächtiger als CSS, z.B. Numerierung
DSSSL in XML Syntax
DOCTYPE ist xsl:stylesheet
kann zusammen mit CSS verwendet werden
Formating Objects (FO) bezeichnen die
elementaren formatierbaren Objekte
bei DSSSL flow objects
XSL Spezifikation definiert FO Vokabular
XSL Bearbeitung erzeugt Baum von FO
xsl:template
wählt Element
aus und beschreibt seine Formatierung
xsl:apply-templates
stößt
Bearbeitung des Inhalts an
EM { font-family: roman }XSLT to HTML:
<xsl:template match="em"> <I> <xsl:apply-templates/> </I> </xsl:template>(XSLT to CSS: )
<xsl:template match="em"> <css:chunk font-family="roman"> <xsl:apply-templates/> </css:chunk> </xsl:template>CSS mit XML:
<?xml-stylesheet href="url" type="text/css" media="screen" ... ?>XSLT to LaTeX:
<xsl:template match="em"> <xsl:text>{\em </xsl:text> <xsl:apply-templates/> <xsl:text>}</xsl:text> </xsl:template>
Beispiel eines XML Dokuments
Konversion nach HTML und LaTeX mit Xalan/Xerces
xsl:import
Einfügen von externen Definitionen (überschreibend)
xsl:include
Einfügen von externen Definitionen (kombinierend)
xsl:id
Definition von eindeutigen Bezeichnern
xsl:strip-space elements="..."
,
xsl:preserve-space elements="..."
Entfernen oder Einfügen von Leerraum im Inhalt
für bestimmter Elemente
xsl:variable
, xsl:param
Definition von Variablen und Parametern
xsl:key
Definition von Schlüsseln
xsl:decimal-format
,
xsl:namespace-alias
Definition von Zahlenformaten und Aliasen
xsl:attribute-set
definiert Liste von Attributen
xsl:output
Definition der Charakteristika der Ausgabe
xsl:template
Definition von Ersetzungsmustern
<xsl:template match="pattern">
Definition eines Erkennungsmusters
alles in (fast) beliebiger Reihenfolge im Top-Level
Aus Knoten (nodes) eines Dokuments werden Ergebnisknoten gebildet.
Knoten sind: Elemente, Attribute, etc.
match
und select
jetzt Spezifikation in XPath mit Erweiterungen durch XSLT eigene Funktionen
Erkennung erfolgt relativ zum aktuellen (current) Knoten
p1 | p2
mehrere Patterns als Alternativen
n1/n2
Kontextangabe, n2 als Subknoten von n1, eine Ebene
/
Root Knoten
n1//n2
Kontextangabe, n2 als Subknoten von n1, beliebig tiefere Ebene
*/p
Wildcard, p als Subknoten irgendwas
.
aktueller (current) Knoten
..
Elternknoten
@attname
selektiert ein bestimmtes Attribut
[ test ]
selektiert Knoten, für die "test" zu trifft
list[@type="ordered"]
selektiert Listen vom Typ "geordnet"
weitere Tests:
first-of-any()
,
last-of-any()
first-of-type()
,
last-of-type()
id(n)
, ancestor()
weitere Funktionen:
document(obj,ns)
,
key(string,obj)
,
format-number(num,string,string?)
,
Beispiel
section/list[@type="ordered" and last-of-type()]
Templates erzeugen Stil-Ausgabe und stossen die Verarbeitung von (Sub-) Knoten an.
Literale, die XSL nicht kennt, werden in den (Ausgabe-) Knoten kopiert
xsl:text
oder unbekannte Literale
erzeugen einen Text-Knoten
xsl:element name=".."
erzeugt einen extra Element-Knoten mit angegebenem Namen
xsl:attribute name=".."
erzeugt einen extra Attribut-Knoten mit angegebenem Namen
xsl:processing-instruction
erzeugt einen Processing-Instruktion-Knoten
<xsl:processing-instruction name="php">echo "Hallo"; </xsl:pi>erzeugt
<?php echo "Hallo"; ?>
xsl:comment
erzeugt einen Kommentar-Knoten
xsl:message terminate="yes"|"no"
erzeugt eine Nachricht und wartet ggf. auf Eingabe vom Anwender
xsl:apply-templates select="pattern"
allgemeiner Aufruf der Template-Verarbeitung
select="pattern"
ist (bei allen Verarbeitungstemplates)
optional, falls vorhanden werden nur Knoten des pattern-Typs
ausgewählt, sonst alle
xsl:for-each select="..."
Verarbeitung für alle (angegebenen) Subknoten
mode="bezeichnung"
wählt nur Templates mit dem gleichen mode-Attribut
xsl:sort order=(ascending|descending)
data-type=(text|number)
lang=language
case-order=(upper-first|lower-first)
Sortiert entsprechend den Kriterien in
xsl:apply-templates
und
xsl:for-each
xsl:number level=(single|multi|any)
count="bezeichner"
from="start-wert"
format="beispiel"
erzeugt Nummern-Knoten entsprechend den Vorgaben bezüglich
der Eingabeknoten
xsl:counter name="bezeichner"
format="beispiel"
erzeugt Nummern-Knoten entsprechend den Vorgaben bezüglich
der Ausgabeknoten
xsl:counter-increment="bezeichner"
xsl:counter-reset="bezeichner"
format="beispiel"
erzeugt Knoten entsprechend dem Format-Beispiel
beispiel=(1|A|a|i|I|001)
digit-group-sep=","
n-digits-per-group="3"
xsl:if test="bedingung"
Verarbeitung nur falls die Bedingung wahr ist
xsl:choose
mit
xsl:when test="bedingung"
Verarbeitung wie in "switch" nur falls die Bedingung wahr ist
xsl:copy
Kopiert den aktuellen Knoten
xsl:value-of select="pattern"
berechnet den Wert des angegebenen Musters,
z.B. eines Attributs
xsl:constant name=".." value=".."
definiert (Literal-) Konstanten
Zunächst für Online und Druck-Dokumente.
Spezifikation der grundlegenden Elemente, ohne die Details einer Implementierung festzulegen.
Formatierung durch areas (wie box in CSS) und spaces (Zwischenräume).
fo:block
Formatierung eines Blocks mit diversen Attributen
fo:character
Formatierung eines Zeichens mit diversen Attributen
fo:display-graphic
Formatierung einer Grafik (z.B. GIF-Image) mit diversen Attributen
fo:list-block
Formatierung einer Liste von Blocks mit diversen Attributen
fo:list-item
Formatierung eines Listenelements mit diversen Attributen
background-color
Attribut für Hintergrundfarbe
font-style
Attribut für Schriftstil
SAX
Simple API for XML
XML4J
XML-Parser in Java von IBM, mit DTD und DOM1
msxml
XML-Parser in Java von Microsoft, mit DOM1 ohne DTD
Xalan,
Xerces
Tools der Apache XML Aktivitäten
Koala
XSL Processor
Lotus
XSL Processor
RDF
Resource Description Framework
PICS, CDF, CRP
OSD Open Software Distribution
SVG Scalable Vector Graphics, Vektorgrafik
SMIL Synchronized Multimedia Integration Language
CML Chemical Markup Language
MML Mathematical Markup Language
OASIS, Organization for the Advancement of Structured Information Standards
OFX, Open Financial Exchange
CommerceNet, EDI B2B, e-Commmerce Framework, EDI via XML
Ariba - cXML, Transaktionen: Aufträge, Rechnungen, Änderungsaufträge
finXML, XML für Finanzmärkte, Zinssätze, Währungsumtausch, Bonds, Geldmärkte, Anlagen, Optionen
Acord, XML Standards für die Versicherungswirtschaft
Rosettanet, IT supply chain alignment, server-to-server business exchange
OBI, Open Buying Initiative
Open Travel Alliance
Open Trading Protocol
Open Financial Excange
Ersatz und Erweiterung für XML DTD
(Neben-)bedingungen für Aufbau der Dokumentenstruktur
z.B. Anzahl bestimmter Elemente
Bedingungen über Datentypen für Elemente und Attribute
z.B. Integer, Float, URL
Objektorientierung und Vererbung
zur Zeit noch mehrere konkurierende Ansätze
beim W3C im Working Draft Zustand
Beispiel in XML
<!ELEMENT KontoStand (#PCDATA) >und XML-Schema
<elementType name="KontoStand"> <datatypeRef name="real" /> </elementType>
6. Januar 2000
XML 1.0,
W3C Recommendation, 10. Feb. 1998
XSL Transormations (XSLT) 1.0,
W3C Recommendation, 16. Nov. 1999
XML Path Language (XPath) 1.0,
W3C Recommendation, 16. Nov. 1999
XML Names, Namespaces in XML
W3C Recommendation, 17. Jan. 1999
Associating Style Sheets with XML documents
W3C Recommendation, 29. June 1999
XSL 1.0, (jetzt aufgeteilt)
W3C Working Draft, 16. Dec. 1998
XML Schema, Part 1 Structures, Part 2 Datatypes,
W3C Working Draft, 17. Dez. 1999
XML Linking Language (XLink),
W3C Working Draft, 20. Dez. 1999
XML Pointer Language (XPointer),
W3C Working Draft, 6. Dez. 1999
© Universität Mannheim, Rechenzentrum, 1998-2000.
Heinz Kredel Last modified: Tue Feb 8 14:52:00 MET 2000