WYSIWIG oder Markup
Dauerhafte Speicherung über Software-Generationen hinweg
Markup der Text Encoding Initiative TEI
SGML, flexibel bei Eingabe
XML, Internet geeignet, strenge Vorschriften bei Eingabe
Texteingabe mit einem geeigneten Editor direkt von der gescannten Buchseite am Bildschirm
Tag-Library: für Camena angepasste Teilmenge von TEI-XML
Problem: viele Ungenauigkeiten, fehlende Markierungen, meist nicht well-formed
XML Validierung notwendig
Java Xerces Tool (XML Parser der Apache Org)
aufwendiger Prozess
Nachbesserungen wegen Datenaustausch
<lg><l> ... </l></lg> - Problem
TEI-Header
Direkte Darstellung mit Browsern noch nicht überall möglich
daher Konversion nach HTML
Einsatz von XSLT Extensible Style Sheet Language Transformations
mit Java Xalan Tool (war früher Lotus XSL Tool)
Links zu den gescannten Bildern, Links zu Personen, Orten, etc.
<pb id="bildname" n="zaehlung" >
<a href="pfad/bildname.typ" >bildname</a>
Informationsumgebung (reading environment)
nur Mittel für Scannen und Texteingabe
Mittel für Programmierung und Anpassungen erforderlich
im April 2002 genehmigt
es gibt (Hilfskraft-)Mittel für Programmierung und Anpassungen
Texterfassung durch Datentypisten (in China)
Folge: es gibt (fast) kein Markup mehr
Kooperation mit Perseus in USA
haben Tools zur Analyse der Texte
© Universität Mannheim, 2002.
Heinz Kredel Last modified: Tue Jun 4 19:52:41 MEST 2002