Standoff-Markup für Editionen und Paratexte

Klaus Prätor

Where have you gone, XML?

Vor ziemlich genau zehn Jahren nahm ich an einer kleinen, aber feinen Tagung zur Textauszeichnung am Deutschen Literaturarchiv teil. Auf dem Heimweg kam mir in den Sinn, wie sehr sich die Praxis der Textauszeichnung doch im Lauf der Jahre verändert hatte. Ich fasste die Gedanken in einem Blogbeitrag zusammen und wählte als Titel die Frage – oder auch den Seufzer: Where have you gone, XML?

An XML selbst hat sich eigentlich nichts Wesentliches geändert. Es war und ist mehr oder weniger der gleiche Standard wie ein paar Jahre vorher. Geändert hat sich aber der Gebrauch von XML beziehungsweise von Markup generell. Dem Vorläufer SGML ging es zunächst um das sachliche Markup, das DIE sachliche Textstruktur unabhängig von jeder grafischen Gestaltung festhalten wollte. Mit XML gab es dann die Möglichkeit, eigene Tags zu definieren und damit weitergehende, im Prinzip beliebige Auszeichnungen vorzunehmen. Davon wurde auch reichlich Gebrauch gemacht. Es wurden Tags geschaffen für die verschiedenen Elemente eines kritischen Apparates, für Kommentare, Metadaten, Personen- und Ortsnamen. Auch grafische Gestaltungselemente des Originaldokuments wie Schriftart oder Zeilenfall werden in Editionen teilweise festgehalten. Es entstanden Auszeichnungssysteme z.B. für linguistische, literaturwissenschaftliche oder historische Zwecke.

Markup überwuchert den Text

Die Quo-Vadis-Frage ließ schon anklingen, dass diese Entwicklungen des Markup nicht nur als Fortschritt gesehen werden können. Ein erster und augenfälliger Effekt ist, dass der relative Anteil des Markups gegenüber dem Originaltext wächst, in nicht wenigen Fällen ihn um das Mehrfache übertrifft. Der Beispieltext in Abbildung 1, aus einem Wörterbuch von Campe, der noch nicht einmal vielfältigen Auszeichnungsinteressen dient, sondern nur mit linguistischen Tags versehen wurde, macht das deutlich. Nur die roten Stellen sind originaler Text, der Rest ist Markup.

Weiterlesen „Standoff-Markup für Editionen und Paratexte“