Einleitung
Dublin Core (DC)
Resource Description Framework (RDF)
RDF Sprachkonstrukte
Zusammenfassung und Ausblick
Metadaten: Daten über Daten
Informationen über Informationen
Klassifikation der Daten-Inhalte
Problem: viele Bereiche mit unterschiedlicher Klassifikation
Pizza-Service, Bücher, Autos, Telefonbuch, Dienstleistungen
Problem: kein anerkanntes Schema zur Klassifikation
Bibliothekare habe viele Schema entwickelt
Dublin Core, 1995 definiert
Dublin in USA
Klassifikation durch Menschen: z.B. Yahoo
Klassifikation durch Maschinen: Volltextsuche
Resource Description Framework (RDF)
Rahmen für unterschiedliche Metadaten-Systeme
RDF ist kompatibel zu XML
(Fern-) Ziel: Semantic Web
Ziele für den Entwurf
Einfachheit:
durch Nicht-Experten benutzbar
Semantische Kompatibilität:
über Fachgrenzen hinweg benutzbar
Internationaler Konsens:
von Leuten aus über 30 Ländern erarbeitet
Erweiterbarkeit:
offen für feinere Untergliederung der Metadaten
Anwendbarkeit im Web:
kompatibel mit RDF
Die Bedeutung der Elemente ist wiederum durch die Spezifikation von ISO/ITEC 11179 Attributen festgelegt.
Syntax
unterscheidet "Eigenschaften" und deren "Werte/Inhalte"
DC.Eigenschaft="dc-wert"
alle Eigenschaften sind optional und wiederholbar
die Reihenfolge der Angabe der Eigenschaften ist beliebig
Auflistung:
DC.Eigenschaft="dc-wert1; dc-wert2; dc-wert3"
Hierarchie:
DC.Eigenschaft="dc-wert-1. dc-wert-2. dc-wert-3"
Einbettung in HTML mit meta
-Element
<meta name="DC.Eigenschaft" content="dc-wert">
Wiederholung durch mehrere meta-Elemente
Einbettung in XHTML und XML Dokumente mit RDF
<dc:Eigenschaft> dc-wert </dc:Eigenschaft>
als Attribut dc:Eigenschaft="dc-wert"
Wiederholung durch mehrere dc:Eigenschafts-Elemente
oder RDF Container
Inhalt | Intellektuelle Zugehörigkeit | Status |
---|---|---|
Coverage | Contributor | Date |
Description | Creator | Format |
Type | Publisher | Identifier |
Relation | Rights | Language |
Source | ||
Subject | ||
Title |
Label: Title
Definition: Name der Quelle.
Beispiel:
DC.Title="A Pilot's Guide to Aircraft Insurance"
DC.Title="The Sound of Music"
DC.Title="Green on Greens"
DC.Title="AOPA's Tips on Buying Used Aircraft"
Label: Creator
Definition: Körperschaft/Person, die für die Quelle inhaltlich verantwortlich ist.
Beispiel:
DC.Creator="Duncan, Phyllis-Anne"
DC.Creator="Melendez Santiago; Maria Luz"
DC.Creator="Maimonides"
aber:
DC.Creator="Park Sung Hee"
Im Falle von Organisationen bei denen eine klare Hierarchie vorhanden ist, listen sie die Teile dieser Hierarchie von Grösstem zum Kleinstem, getrennt durch Punkte.
Beispiel:
DC.Creator="United States. Internal Revenue Service"
DC.Creator="Elvis Presley Fan Club"
DC.Creator="Federal Aviation Administration.
Aviation Safety Program."
nicht:
DC.Creator="Aviation Safety Program of the Federal Aviation Administration"
DC.Creator="Art Institute of Chicago"
DC.Creator="Association of the Bar of the City of New York"
DC.Creator="Baltimore County Medical Society"
Label: Subject
Definition: Thema mit dem sich die Quelle beschäftigt.
Beispiel:
DC.Subject="Aircraft leasing and renting"
DC.Subject="Dogs"
DC.Subject="Olympic skiing"
DC.Subject="Street, Picabo"
Label: Description
Definition: Überblick über den Inhalt der Quelle (Abstract, Inhaltsverzeichnis).
Beispiel:
DC.Description="Illustrated guide to airport markings
and lighting signals, with particular reference to SMGCS
(Surface Movement Guidance and Control System) for airports
with low visibility conditions"
Label: Publisher
Definition: Körperschaft/Person, die für die Verfügbarkeit der Quelle verantwortlich ist.
Beispiel:
DC.Publisher="Moguls Anonymous"
DC.Publisher="University of Miami. Dept. of Economics"
DC.Publisher="Free Software Foundation"
Label: Date, Format: YYYY-MM-DD oder YYYY-MM oder YYYY
Definition: Datum der Erstellung oder Veröffentlichung der Quelle.
Beispiel:
DC.Date="1998-02-16"
DC.Date="1998-02"
DC.Date="1998"
Label: Type
Definition: Art oder Genre der Quelle.
Minimale Liste, die für DC empfohlen ist:
Beispiel:
DC.Type="image"
DC.Type="sound"
DC.Type="text"
DC.Type="image"
Multimedia educational program with interactive assignments:
DC.Type="text" DC.Type="image"
DC.Type="software" DC.Type="interactive"
Label: Format, MIME Type
Definition: physikalische oder digitale Manifestation der Quelle (Datenformat, Systemvoraussetzungen).
Beispiel:
DC.Format="image/gif"
Label: Identifier
Definition: eindeutige Referenz der Quelle (URL, ISBN, DOI).
Beispiel:
DC.Identifier="http://purl.oclc.org/metadata/dublin_core/"
DC.Identifier="0385424728"
[ISBN]
DC.Identifier="H-A-X 5690B"
[publisher number]
Label: Source
Definition: Referenz zum Ursprung der Quelle.
Beispiel:
DC.Source="RC607.A26W574 1996"
wobei "RC607.A26W574 1996" z.B. eine Bezeichnung des
gedruckten Werkes ist
Label: Language
Definition: Sprache(n) des Inhalts der Quelle.
Beispiel:
DC.Language="en" DC.Language="fr"
oder
DC.Language="en;fr"
oder
DC.Language="Primarily English, with some abstracts
also in French."
DC.Language="en-US"
Label: Relation
Definition: Referenz auf verwandte Quellen.
Eine Liste von Beziehungstypen:
DC.Title="the present resource"
DC.Relation="relationship-type [space] unique identifer for the related resource"
wobei "relationship-type" aus obiger Liste stammt
Note: In the case where the DC metadata is embedded in the present resource, the value for Identifier is implied (i.e. the present resource). In qualified DC the two components given in Relation here will be structured using sub-elements for easier automated processing.
Beispiel:
DC.Title="Reading Turgenev"
DC.Relation="IsPartOf TwoLives"
eine Sammlung von zwei Novellen, von denen eine "Reading Turgenev" ist
Label: Rights
Definition: Informationen über die Urheberrechte an der Quelle.
Beispiel:
DC.Rights="http://cs-tr.cs.cornell.edu/Dienst/Repository/2.0/Terms"
Label: Coverage
Beispiel:
DC.Coverage="1995-1996"
DC.Coverage="Boston, MA"
oder
DC.Coverage="17th century"
DC.Coverage="Upstate New York"
Label: Contributor
Definition: Sonstige Beitragende zur Quelle.
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" /> <meta name="GENERATOR" content="Emacs" /> <meta name="AUTHOR" content="Heinz Kredel" /> <meta name="CREATED" content="20001208;" />
<meta name="DC.Title" content="DC and RDF" /> <meta name="DC.Creator" content="Kredel, Heinz" /> <meta name="DC.Subject" content="Metadata Systems DC and RDF" /> <meta name="DC.Description" content="Introduction to the DC and RDF Metadata Systems" /> <meta name="DC.Publisher" content="University of Mannheim" /> <meta name="DC.Date" content="2000-12-08" /> <meta name="DC.Type" content="text; image" /> <meta name="DC.Format" content="text/xhtml; image/gif" /> <meta name="DC.Identifier" content="http://krum.rz.uni-mannheim.de/web-tech2000w/sess-20.html" /> <meta name="DC.Language" content="de; en" /> <meta name="DC.Relation" content="IsPartOf http://krum.rz.uni-mannheim.de/web-tech2000w/" />
Ziel: automatisierte Auswertung und Bearbeitung von Metadaten
Auffinden von Quellen (im Web)
Katalogiserung (von Web Inhalten)
Bewertung (Rating) (von Web Inhalten)
Baustein des Web of Trust
Nachfolger von PICS (Platform for Internet Content Selection)
W3C Recommendation, 22 February 1999
Features von RDF
Interoperabilität zwischen Metadaten-Systemen
durch Computer verwertbare Metadaten
Präzision für Metadaten
genauere Markierungen statt einfachen Volltexten
Offenheit für zukünfitige Erweiterungen
Beispiel für RDF mit DC innerhalb einer (X-)HTML Seite
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.0/"> <rdf:Description rdf:about="" [d.h. für dieses Dokument] dc:creator="Karl Dall" dc:title="Mein Dokument" dc:description="Karls Erzählungen über seinen letzten Urlaub." dc:date="2000-08-10" /> </rdf:RDF>
RDF ist ein Framework für Metadaten
d.h. Metasystem für Metadaten
d.h. Daten über (Daten über Daten)
Grundlegendes Datenmodell von RDF:
Resource:
alles was einen URI (plus Fragment-Identifier) haben kann,
d.h. alle Web-Dokumente und per Xpointer selektierbare Teile,
aber z.B. auch realexistierende Bücher
Property
ein Aspekt, eine Eigenschaft, ein Attribut einer Resource,
kann selbst Resource sein, kann einen Namen haben,
z.B. Autor oder Titel, kann wieder eigene Properties haben
Statement
Beziehung zwischen einer Resource, einer Property und einem Wert,
ein Wert kann eine Zeichenkette oder wieder eine Resource sein
definiert Trippel: ( subject, predicate, object )
( eine Resource, eine Property, Wert)
Charakterisika
Unabhängigkeit:
da eine Property eine Resource ist, kann jeder seine eigenen erfinden
Austauschbarkeit
da RDF auf XML basiert, kann es leicht kommuniziert und ausgetauscht
werden
Skalierbarkeit
da ein Statement nur aus den drei Teilen (Resource, Property, Wert)
besteht, können diese in grossen Mengen maschinell verarbeitet werden
Properties sind Resourcen
da Properties selbst wieder Resourcen sind, können sie eigene
Properties haben und diese können per RDF automatisch verarbeitet werden
Werte können Resourcen sein
da Werte selbst wieder Resourcen sein können, können sie auch wieder
eigene Properties haben
Statements können Resourcen sein
da Statements selbst wieder Resourcen sein können, können sie auch wieder
eigene Properties haben
Was RDF nicht bietet
definiert selbst kein Vokabular (wie z.B. Dublin Core) für Metadaten
RDF ist nicht selbst durch eine XML DTD definiert sondern direkt durch EBNF (Extended Backus-Naur Form)
#PCDATA
und Elementenzwei syntaktische Varianten
Serialization Syntax
kompatibel zu XML DTDs, ungeeignet zur Einbettung in HTML
Properties als XML-Elemente, Problem: Element Inhalte
Abbreviated Syntax
(teilweise) nicht kompatibel zu XML DTDs, geeignet zur Einbettung in HTML
Properties als XML-Attribute, Problem: mehrfache Attribute
(mehrere) Statements können durch das Description-Element definiert werden
<rdf:Description about="URI#Xpointer">
PropElem*
</rdf:Description>
Bezeichnung eines (externen) Subjekts
falls "URI#Xpointer" = ""
Definition des aktuellen
Dokuments als Subjekt
<rdf:Description ID="identifier">
PropElem*
</rdf:Description>
Definition dieser Statements als Subjekt der Resource
mit Bezeichnung "identifier"
<rdf:Description>
PropElem*
</rdf:Description>
Anonyme Subjekt Definition diese(s/r) Statements
PropElem*
definiert eine Folge von Properties
als XML-Elemente
<propName resource="URI#Xpointer" />
Definition der Property "propName" als (externe) Resource
<propName> wert </propName>
Definition von "wert" als Wert der Property "propName"
wobei propName
ein mit XML-Namespaces
qualifizierter Name sein kann
Beispiel
<rdf:Description about="http://krum.rz.uni-mannheim.de/web-tech/"> <dc:creator>Heinz Kredel</dc:creator> <dc:title>Web-Technologien</dc:title> <dc:rights rdf:resource="http://www.uni-mannheim.de/copyright.html" /> </rdf:Description>
für die Abbreviated Syntax können statt der Property-Elemente Property-Attribute verwendet werden
<rdf:Description ..subj.. PropAttr* />
Definition des Subjekts ..subj..
wie in der Serialization Syntax
PropAttr*
definiert eine Folge von Properties
als XML-Attribute
PropAttr ist propName="URI#Xpointer"
Definition der Property "propName" als (externe) Resource
PropAttr ist propName="wert"
Definition von "wert" als Wert der Property "propName"
wobei propName
auch wieder ein mit XML-Namespaces
qualifizierter Name sein kann
Container: Sequence, Bag, Alternative
parseType="Literal"
Eingebettet in die Resource
wie in HTML oder XHTML
Extern zur Resource, aber automatisch mitgeliefert
Extern zur Resource, Lieferung nur per expliziter Aufforderung
Umschliessung der Resource
d.h. die Resource ist eingebettet in die RDF Description
bei 2 und 3 sollte folgende Syntax verwendet werden
<link rel="meta" href="mydocMetadata.dc.rdf">
in Abbreviated Syntax
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/" > <rdf:Description about="" dc:Title ="DC and RDF" dc:Creator ="Kredel, Heinz" dc:Subject ="Metadata Systems DC and RDF" dc:Description ="Introduction to the DC and RDF Metadata Systems" dc:Publisher ="University of Mannheim" dc:Date ="2000-12-08" dc:Type ="text; image" dc:Format ="text/xhtml; image/gif" dc:Identifier ="http://krum.rz.uni-mannheim.de/web-tech2000w/sess-20.html" dc:Language ="de; en" dc:Relation ="IsPartOf http://krum.rz.uni-mannheim.de/web-tech2000w/" /> </rdf:RDF>
in Serialization Syntax
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/" > <rdf:Description about="" > <dc:Title >DC and RDF</dc:Title > <dc:Creator >Kredel, Heinz</dc:Creator > <dc:Subject >Metadata Systems DC and RDF</dc:Subject > <dc:Description >Introduction to the DC and RDF Metadata Systems</dc:Description > <dc:Publisher >University of Mannheim</dc:Publisher > <dc:Date >2000-12-08</dc:Date > <dc:Type >text; image</dc:Type > <dc:Format >text/xhtml; image/gif</dc:Format > <dc:Identifier >http://krum.rz.uni-mannheim.de/web-tech2000w/sess-20.html</dc:Identifier > <dc:Language >de; en</dc:Language > <dc:Relation >IsPartOf http://krum.rz.uni-mannheim.de/web-tech2000w/</dc:Relation > </rdf:Description> </rdf:RDF>
in externer Datei
sess-20.html.rdf oder
sess-20.html.rdf.txt,
Zugriff mit:
<link rel="meta" href="sess-20.html.rdf" />
RDF Schema, Candidate Recommendation, März 2000
Semantic Web
Ableitung von Eigenschaften aud RDF Behauptungen
Digital Object Identifier (DOI)
10.1000.99/ISBN-3-932588-28-2
© Universität Mannheim, Rechenzentrum, 1998-2001.
Heinz Kredel Last modified: Sun Feb 4 17:23:38 MET 2001