Einleitung
Dublin Core (DC) und HTML
Resource Description Framework (RDF)
RDF Sprachkonstrukte
Zusammenfassung und Ausblick
Metadaten: Daten über Daten
Informationen über Informationen
Klassifikation der Daten-Inhalte
Problem: viele Bereiche mit unterschiedlicher Klassifikation
Pizza-Service, Bücher, Autos, Telefonbuch, Dienstleistungen
Problem: kein anerkanntes Schema zur Klassifikation
Bibliothekare habe viele Schema entwickelt
Dublin Core, 1995 definiert
Dublin in USA
Klassifikation durch Menschen: z.B. Yahoo
Klassifikation durch Maschinen: Volltextsuche
Resource Description Framework (RDF)
Rahmen für unterschiedliche Metadaten-Systeme
RDF ist kompatibel zu XML
(Fern-) Ziel: Semantic Web
Ziele für den Entwurf
Einfachheit:
durch Nicht-Experten benutzbar
Semantische Kompatibilität:
über Fachgrenzen hinweg benutzbar
Internationaler Konsens:
von Leuten aus über 30 Ländern erarbeitet
Erweiterbarkeit:
offen für feinere Untergliederung der Metadaten
Anwendbarkeit im Web:
kompatibel mit RDF
Die Bedeutung der Elemente ist wiederum durch die Spezifikation von ISO/ITEC 11179 Attributen festgelegt.
Syntax
unterscheidet "Eigenschaften" und deren "Werte/Inhalte"
DC.Eigenschaft="dc-wert"
alle Eigenschaften sind optional und wiederholbar
die Reihenfolge der Angabe der Eigenschaften ist beliebig
Auflistung:
DC.Eigenschaft="dc-wert1; dc-wert2; dc-wert3"
Hierarchie:
DC.Eigenschaft="dc-wert-1. dc-wert-2. dc-wert-3"
Einbettung in HTML mit meta
-Element
<meta name="DC.Eigenschaft" content="dc-wert">
Wiederholung durch mehrere meta-Elemente
Einbettung in XHTML und XML Dokumente mit RDF
<dc:Eigenschaft> dc-wert </dc:Eigenschaft>
als Attribut dc:Eigenschaft="dc-wert"
Wiederholung durch mehrere dc:Eigenschafts-Elemente
oder RDF Container
Inhalt | Intellektuelle Zugehörigkeit | Status |
---|---|---|
Coverage | Contributor | Date |
Description | Creator | Format |
Type | Publisher | Identifier |
Relation | Rights | Language |
Source | ||
Subject | ||
Title |
Label: Title
Definition: Name der Quelle.
Beispiel:
<META NAME="DC.Title" CONTENT="A Pilot's Guide to
Aircraft Insurance">
<META NAME="DC.Title" CONTENT="The Sound of Music">
<META NAME="DC.Title" CONTENT="Green on Greens">
<META NAME="DC.Title" CONTENT="AOPA's Tips on Buying
Used Aircraft">
Label: Creator
Definition: Körperschaft/Person, die für die Quelle inhaltlich verantwortlich ist.
Beispiel:
<META NAME="DC.Creator" CONTENT="Duncan, Phyllis-Anne">
Creator="Melendez Santiago, Maria Luz"
Creator="Maimonides"
aber:
<META NAME="DC.Creator" CONTENT="Park Sung Hee">
Im Falle von Organisationen bei denen eine klare Hierarchie vorhanden ist, listen sie die Teile dieser Hierarchie von Grösstem zum Kleinstem, getrennt durch Punkte.
Beispiel:
Creator="United States. Internal Revenue Service"
Creator="Elvis Presley Fan Club"
<META NAME="DC.Creator" CONTENT="Federal Aviation
Administration. Aviation Safety Program.">
nicht:
<META NAME="DC.Creator" CONTENT="Aviation Safety
Program of the Federal Aviation Administration">
<META NAME="DC.Creator" CONTENT="Art Institute of Chicago">
Creator="Association of the Bar of the City of New York"
Creator="Baltimore County Medical Society"
Label: Subject
Definition: Thema mit dem sich die Quelle beschäftigt.
Beispiel:
<META NAME="DC.Subject" CONTENT="Aircraft leasing and renting">
Subject="Dogs"
Subject="Olympic skiing"
Subject="Street, Picabo"
Label: Description
Definition: Überblick über den Inhalt der Quelle (Abstract, Inhaltsverzeichnis).
Beispiel:
<META NAME="DC.Description" CONTENT="Illustrated guide
to airport markings and lighting signals, with particular reference
to SMGCS (Surface Movement Guidance and Control System) for airports
with low visibility conditions">
Label: Publisher
Definition: Körperschaft/Person, die für die Verfügbarkeit der Quelle verantwortlich ist.
Beispiel:
<META NAME="DC.Publisher" CONTENT="Moguls Anonymous">
Publisher="University of Miami. Dept. of Economics"
Publisher="Free Software Foundation"
Label: Date, Format: YYYY-MM-DD oder YYYY-MM oder YYYY
Definition: Datum der Erstellung oder Veröffentlichung der Quelle.
Beispiel:
<META NAME="DC.Date" CONTENT="1998-02-16">
<META NAME="DC.Date" CONTENT="1998-02">
<META NAME="DC.Date" CONTENT="1998">
Label: Type
Definition: Art oder Genre der Quelle.
Minimale Liste, die für DC empfohlen ist:
Beispiel:
<META NAME="DC.Type" CONTENT="image">
Type="sound"
Type="text"
Type="image"
Multimedia educational program with interactive assignments:
Type="text" Type="image"
Type="software" Type="interactive"
Label: Format, MIME Type
Definition: physikalische oder digitale Manifestation der Quelle (Datenformat, Systemvoraussetzungen).
Beispiel:
<META NAME="DC.Format" CONTENT="image/gif">
Label: Identifier
Definition: eindeutige Referenz der Quelle (URL, ISBN, DOI).
Beispiel:
<META NAME="DC.Identifier" CONTENT="http://purl.oclc.org/metadata/dublin_core/">
Identifier="0385424728" [ISBN]
Identifier="H-A-X 5690B" [publisher number]
Label: Source
Definition: Referenz zum Ursprung der Quelle.
Beispiel:
<META NAME="DC.Source" CONTENT="RC607.A26W574 1996">
[where "RC607.A26W574 1996" is the call number of the print version of the resource, from which the present version was scanned]
Label: Language
Definition: Sprache(n) des Inhalts der Quelle.
Beispiel:
Language="en" Language="fr"
oder
<META NAME="DC.Language" CONTENT="en;fr">
oder
<META NAME="DC.Language" CONTENT="Primarily English,
with some abstracts also in French.">
<META NAME="DC.Language" CONTENT="en-US">
Label: Relation
Definition: Referenz auf verwandte Quellen.
Eine Liste von Beziehungstypen:
Title="the present resource"
Relation="relationship-type [space] unique identifer for the related resource"
where "relationship-type" is a token drawn from the list above.
Note: In the case where the DC metadata is embedded in the present resource, the value for Identifier is implied (i.e. the present resource). In qualified DC the two components given in Relation here will be structured using sub-elements for easier automated processing.
Beispiel:
Title="Reading Turgenev"
Relation ="IsPartOf TwoLives"
[collection of two novellas, one of which is "Reading Turgenev"]
Label: Rights
Definition: Informationen über die Urheberrechte an der Quelle.
Beispiel:
<META NAME="DC.Rights"
CONTENT="http://cs-tr.cs.cornell.edu/Dienst/Repository/2.0/Terms">
Label: Coverage
Beispiel:
Coverage="1995-1996"
Coverage="Boston, MA"
oder
<META NAME="DC.Coverage" CONTENT="17th century">
<META NAME="DC.Coverage" CONTENT="Upstate New York">
Label: Contributor
Definition: Sonstige Beitragende zur Quelle.
Ziel: automatisierte Auswertung und Bearbeitung von Metadaten
Auffinden von Quellen (im Web)
Katalogiserung (von Web Inhalten)
Bewertung (Rating) (von Web Inhalten)
Baustein des Web of Trust
Nachfolger von PICS (Platform for Internet Content Selection)
W3C Recommendation, 22 February 1999
Features von RDF
Interoperabilität zwischen Metadaten-Systemen
durch Computer verwertbare Metadaten
Präzision für Metadaten
genauere Markierungen statt einfachen Volltexten
Offenheit für zukünfitige Erweiterungen
Beispiel für RDF mit DC innerhalb einer (X-)HTML Seite
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.0/"> <rdf:Description rdf:about="" [d.h. für dieses Dokument] dc:creator="Karl Dall" dc:title="Mein Dokument" dc:description="Karls Erzählungen über seinen letzten Urlaub." dc:date="2000-08-10" /> </rdf:RDF>
RDF ist ein Framework für Metadaten
d.h. Metasystem für Metadaten
d.h. Daten über (Daten über Daten)
Grundlegendes Datenmodell von RDF:
Resource:
alles was einen URI (plus Fragment-Identifier) haben kann,
d.h. alle Web-Dokumente und per Xpointer selektierbare Teile,
aber z.B. auch realexistierende Bücher
Property
ein Aspekt, eine Eigenschaft, ein Attribut einer Resource,
kann selbst Resource sein, kann einen Namen haben,
z.B. Autor oder Titel, kann wieder eigene Properties haben
Statement
Beziehung zwischen einer Resource, einer Property und einem Wert,
ein Wert kann eine Zeichenkette oder wieder eine Resource sein
definiert Trippel: ( subject, predicate, object )
( eine Resource, eine Property, Wert)
Beispiel
<rdf:Description about="http://krum.rz.uni-mannheim.de/web-tech/"> <dc:creator>Heinz Kredel</dc:creator> <dc:title>Web-Technologien</dc:title> </rdf:Description>
Charakterisika
Unabhängigkeit:
da eine Property eine Resource ist, kann jeder seine eigenen erfinden
Austauschbarkeit
da RDF auf XML basiert, kann es leicht kommuniziert und ausgetauscht
werden
Skalierbarkeit
da ein Statement nur aus den drei Teilen (Resource, Property, Wert)
besteht, können diese in grossen Mengen maschinell verarbeitet werden
Properties sind Resourcen
da Properties selbst wieder Resourcen sind, können sie eigene
Properties haben und diese können per RDF automatisch verarbeitet werden
Werte können Resourcen sein
da Werte selbst wieder Resourcen sein können, können sie auch wieder
eigene Properties haben
Statements können Resourcen sein
da Statements selbst wieder Resourcen sein können, können sie auch wieder
eigene Properties haben
Was RDF nicht bietet
definiert selbst kein Vokabular (wie z.B. Dublin Core) für Metadaten
RDF ist nicht durch eine XML DTD zu ersetzen
#PCDATA
und Elementenzwei syntaktische Varianten
Serialization Syntax
geeignet als XML DTD, ungeeignet zur Einbettung in (X-)HTML
Abbreviated Syntax
ungeeignet als XML DTD, geeignet zur Einbettung in (X-)HTML
(mehrere) Statements können durch das Description-Element definiert werden
<rdf:Description about="URI#Xpointer">
PropElem*
</rdf:Description>
Bezeichnung eines (externen) Subjekts
falls "URI#Xpointer" = ""
Definition des aktuellen
Dokuments als Subjekt
<rdf:Description ID="identifier">
PropElem*
</rdf:Description>
Definition dieser Statements als Subjekt der Resource
mit Bezeichnung "identifier"
<rdf:Description>
PropElem*
</rdf:Description>
Anonyme Subjekt Definition diese(s/r) Statements
PropElem*
definiert eine Folge von Properties
als XML-Elemente
<propName resource="URI#Xpointer" />
Definition der Property "propName" als (externe) Resource
<propName> wert </propName>
Definition von "wert" als Wert der Property "propName"
wobei propName
ein mit XML-Namespaces
qualifizierter Name sein kann
für die Abbreviated Syntax können statt der Property-Elemente Property-Attribute verwendet werden
<rdf:Description ..subj.. PropAttr* />
Definition des Subjekts ..subj..
wie in der Serialization Syntax
PropAttr*
definiert eine Folge von Properties
als XML-Attribute
PropAttr ist propName="URI#Xpointer"
Definition der Property "propName" als (externe) Resource
PropAttr ist propName="wert"
Definition von "wert" als Wert der Property "propName"
wobei propName
auch wieder ein mit XML-Namespaces
qualifizierter Name sein kann
Container: Sequence, Bag, Alternative
parseType="Literal"
Eingebettet in die Resource
wie in HTML oder XHTML
Extern zur Resource, aber automatisch mitgeliefert
Extern zur Resource, Lieferung nur per expliziter Aufforderung
Umschliessung der Resource
d.h. die Resource ist eingebettet in die RDF Description
bei 2 und 3 sollte folgende Syntax verwendet werden
<LINK rel="meta" href="mydocMetadata.DC.RDF">
RDF Schema, Proposed Recommendation, März 1999
Semantic Web
Ableitung von Eigenschaften aud RDF Behauptungen
© Universität Mannheim, Rechenzentrum, 1998-2001.
Heinz Kredel Last modified: Sun Dec 10 11:56:33 MET 2000