preXtension Logo
preXtension
Jörg Schiessel
Mauerner Straße 2
82284 Grafrath
Telefon (08144) 9979-21

Internet: www@prextension.de
E-Mail: info@prextension.de
preXtension Logo
Cross Media Publishing

SGML, XML, HTML

Eine medienneutrale Datenaufbereitung in SGML bzw. XML ermöglicht eine zentrale Datenhaltung in anwendungsneutraler Form. Die Ausgabe für Print, CD-ROM und Internet erfolgt aus einem prüfbaren und konsistenten Datenpool in unmittelbar medienspezifischer Form.

Datenformat und Nutzung

Für die heutigen Möglichkeiten zur Informationsverbreitung im Internet, als Software auf CD-ROM, Applikation oder als Print-Werk ist offene und flexible Datenhaltung unerlässlich. Damit treten Auszeichnungs- bzw. Strukturierungssprachen wie SGML, XML, HTML und XHTML neben Datenbanken in den Produktionsabläufen in den Vordergrund.

SGML ist eine medienneutrale Auszeichnungssprache, die einem ISO-Standard entspricht und sich damit als Grundlage für Datenhaltung, Datenaustausch und Ausgabe auf verschiedene Medien hervorragend eignet.

Neben SGML gibt es XML als echte Untermenge von SGML und als weiteres viel genutztes Derivat von SGML die Hypertext Markup Language (HTML). HTML ist schon seit langem die Auszeichnungssprache für das Internet und die Möglichkeiten zur Darstellung wurden in den vergangenen Jahren enorm weiterentwickelt.

DTD-/Schema-Modellierung und -Erstellung

Vor der Strukturierung der Daten muss die Arbeit zur Entwicklung einer sogenannten Dokument Typ Definition (DTD) oder einem Schema geleistet werden. Darunter versteht man eine Vorschrift, in der festgelegt wird, welche Elemente in welcher Reihenfolge verwendet werden dürfen, im Falle eines Schemas sind zusätzlich semantische Vorgaben möglich. Die Einhaltung dieser Vorschrift gewährleistet, dass das Dokument in sich schlüssig/logisch strukturiert ist und damit für eine Weiterverarbeitung (Ausgabe in andere Formate oder Anwendungen) optimale Voraussetzungen bietet.

Um effektiv mit SGML/XML arbeiten zu können, ist bei der Entwicklung von Strukturierungsvorgaben (DTD/Schema) besonders auf ein möglichst flexibles aber dennoch eindeutiges Dokument-Design zu achten. Im Vordergrund stehen dabei Ihre Nutzungsanforderungen an Ihre Inhalte (Publikation in verschiedenen Medien, Archivierung, Integration in Dokumenten-Management-Systeme, etc.).

Konvertierung und Erfassung der Quelldaten

Liegt eine DTD vor, müssen die von Ihnen angelieferten Daten (MS Word, RTF, PDF, Datenbank etc.) dementsprechend medienneutral aufbereitet werden. Im günstigsten Fall sind die Quelldaten bereits vorher "sauber" strukturiert worden (z. B. mittels Formatvorlagen in Word) und liegen als Quellformat in digitaler Form vor.

Die Umwandlung Ihrer Daten geschieht über Konvertier-Routinen oder über ein von uns für diesen Zweck geschriebenes Programm. Der Problematik, dass Ihre Quelldaten falsch, unvollständig, nicht einheitlich oder gar nicht strukturiert sein können, widmen wir uns mit geeigneten Prüfmechanismen bereits während der Konvertierung.

Nicht algorithmisch greifbare Unstimmigkeiten müssen jedoch manchmal manuell mit Hilfe eines sog. Parsers (die erzielte Struktur wird gegen die Vorgaben der DTD/des Schemas geprüft) behoben werden.

Durch unsere speziell dafür entwickelten Tools können wir auch unstrukturierte Daten (z. B. MS Word ohne korrekt angewandte Dokumentvorlage) auf hohem Automatisierungsniveau strukturieren und in das gewünschte Zielformat konvertieren.

Im ungünstigsten Fall liegt nur ein Manuskript vor. Das Manuskript wird bei uns erfasst, mit den notwendigen Strukturen versehen und anschließend in die endgültige Form gebracht.

Weiterverarbeitung

Liegen die Daten in einer voll definierten Struktur wie XML vor, sind wir in der Lage, diese in nahezu jedes erwünschte Format auszuspielen. Für die Daten(weiter)verarbeitung muss pro DTD/Schema und Medium ein Ausgabemodul erstellt werden – immer mit dem gleichen Ziel: den Produktionsablauf weitestgehend zu automatisieren.

Kontakt
preXtension
Jörg Schiessel
Mauerner Straße 2
82284 Grafrath
Anrufen
E-Mail senden
Anfahrt