Editionen im Zeitalter ihrer Digitalisierung – Bleibendes und Aktuelles

Klaus Prätor

Digitale Texte

Die Digitalisierung ist nicht EINE und nicht in erster Linie eine technische Neuerung. Sie beruht auf einer Vielzahl  technischer Innovationen (bei Speichern, Bildschirmen, Prozessoren und Übertragungstechniken), die aber durch eine Idee oder_EIN Konzept _ verbunden sind : die binäre Codierung (die berühmten Nullen und Einsen). Diese wurde kulturgeschichtlich vorbereitet durch die Entwicklung der Schrift, insbesondere der Alphabetschrift mit der Segmentierung der Sprache und ihrer Beschränkung auf einen definierten Vorrat diskreter Zeichen.  Die binäre Codierung radikalisiert dies durch die völlige Abstrahierung von einer grafischen Gestalt der Zeichen. Dieses Konzept erlaubt es, vielfältige technische Geräte zu verknüpfen und so ungeahnte Möglichkeiten zu realisieren. Umgekehrt wäre das Konzept ohne die modernen technischen Möglichkeiten nie so wirkungsmächtig geworden. Digitalisierung ist ja kein Vorteil an sich. Weder der antike Schreiber noch seine Leser hätten es als Fortschritt empfunden, wenn er seine Inschriften in binärer Form in Stein gehauen oder in Ton geritzt hätte.

Weiterlesen „Editionen im Zeitalter ihrer Digitalisierung – Bleibendes und Aktuelles“

YAGO: A Large Ontology from Wikipedia and WordNet

Abstract

YAGO ist ein Projekt des Max-Planck-Instituts für Computer Science, Saarbruecken zur Erstellung einer großen Ontologie hoher Präzision unter Rückgriff auf Wikipedia und WordNet. Sein praktische Bedeutung liegt darin, dass er semantische Suchmöglichkeiten für Wikipedia schafft und dabei die nur bedingt für Ontologien geeignete Wikipedia-eigene Taxonomie durch die von WordNet ersetzt. Theoretisch interessant sind semantische Ergänzungen zu RDFS (Relationsidentifikatoren und natürlichere Handhabung mehrstelliger Relationen) und die Vermeidung von gewissen Einschränkungen von OWL. zumindest in deren jetziger Fassung (Formulierung von Transitivität und azyklischen Graphen) Weiterlesen „YAGO: A Large Ontology from Wikipedia and WordNet“

Programmieren – from a logical point of view

Um nach einer längeren Unterbrechung dieses Blogthema wieder aufzunehmen, versuche ich mal, meine Interessen im Umfeld Logikprogrammierung aufzulisten. Ich mache das historisch, die ganz alten Sachen zuerst, die neueren am Ende. Das muss man nicht alles durchlesen. Die fett hervorgehobenen Worte geben eine Orientierung.

Mein erstes Prolog, das ich beruflich einsetzte, war LPA- Prolog. Es hatte zwei Features, die zumndest damals nicht typisch für Prolog waren, aber wichtig für meine Anwendungen.

Weiterlesen „Programmieren – from a logical point of view“

Eisberg der Referenz

Zitieren ist nur die Spitze des Eisbergs der Referenz. Das motivierte meinen Vortrag auf der Jahrestagung der Text Encoding Initiative (TEI) vom 11. bis zum 16. Oktober in Würzburg. Er trägt den Titel „Reference and Annotation. From Citation to ,Watson‘“ und knüpft an an meine früheren Vorschläge, das am Seitenfall orientierte wissenschaftliche Zitieren nach Seite und Zeile durch den Bezug auf sinntragende Einheiten wie Wort oder Satz zu ersetzen. Damit eröffnen sich aber auch neue Möglichkeiten für Kommentierung und Auszeichnung von Texten, insbesondere durch Weisen des externen Bezugs (Stand-off Markup). Diesem Konzept folgt auch die

Unordered Information Management Architecture. Sie wurde von IBM in einer spektakulären Anwendung eingesetzt, wo in einem populären USA-Quiz über Allgemeinwissen im Februar diesen Jahrs ein Computer (Watson) zwei menschliche Champions schlug. Wer es genauer wissen will, kann sich die Folien ansehen oder das Abstract lesen.

Templates für Annotationen

Auf dem TEI-Kongress war ich fleißig und habe noch ein zweites Referat „Template Based Analysis“ gehalten – in einem Workshop von Dietmar Seipel zum Thema „Analysing Electronic Dictionaries with TEI“.

Templates sind Textschablonen, vergleichbar Formularen. In ein festes Textgerüst sind Leerstellen eingebaut, die manuell oder z.B. aus Datenbanken automatisch ausgefüllt werden. Sie sind wichtig, weil sie Arbeitsteilung und -strukturierung ermöglichen. Sie sind interessant, weil sie ineinander verschachtelt werden und so komplexe Strukturen erzeugen können, wie schön an Kochrezepten (Bild) zu sehen ist. Weiterlesen „Templates für Annotationen“

Drupal Gardens

Diesen Blog schreibe ich ja mit iWeb, einem einfachen, wie ich finde ganz hübschen Webeditor oder vielleicht auch schon CMS – einfach im Sinn der Handhabung, aber auch im Hinblick auf die Möglichkeiten. Für den Blog reicht es, aber nicht für manche Sachen, die mir so in den Sinn kommen. Und so bin ich schon länger auf der Suche nach einem Content Management System. Nun gibt es davon ja sehr viele mit vielen Vor- und Nachteilen. Ich konnte mich nicht entscheiden. Weiterlesen „Drupal Gardens“

UIMA in Würzburg

Mein Prologseminar für das Fach Digital Humanities ist heute zu Ende gegangen. Den Vorsatz, bis zu einer Implementierung der Unstructured Information Management Applications (UIMA). zu gelangen, haben wir nicht ganz erfüllt, aber immerhin sind wir doch bis in die Nähe gelangt. Mit diesem Kürzel lassen sich meine heutigen Aktivitäten in Würzburg (Bild) miteinander in Beziehung setzen. Weiterlesen „UIMA in Würzburg“

PROgrammation LOGique

Wie im letzten Jahr verbringe ich einen Teil des Sommers mit dem Versuch, mittels eines Lehrauftrags an der Uni Würzburg, die informatorische Bildung zu verbreitern, diesmal mit einem Kurs zur Programmierung in Prolog. Eigentlich sollte es um Programmieren im Allgemeinen gehen, aber meine nicht zu verheimlichende Neigung zu Prolog hat sich nun auch im Titel niedergeschlagen. Prolog, derzeit nicht die modischste aller Programmiersprachen, hat gleichwohl vor kurzem einen spektakulären Erfolg errungen. In der Nachfolge ihres schachweltmeisterbesiegenden Computers Deep Blue trat IBM nun mit einem Computer Watson in einem USA-Quiz zur Allgemeinbildung an – und hat gegen zwei ausgewiesene Champions gewonnen.  Weiterlesen „PROgrammation LOGique“

Zitieren im digitalen Medium

Schon im letzten Jahr hatte ich in Frankfurt einen Vortrag „Zur Zukunft des Zitierens“ gehalten. Mittlerweile habe ich ihn ausgearbeitet und er soll in dieser Form in der nächsten Ausgabe von „editio“ erscheinen.

Mit ihrer Digitalisierung verändert sich die Materialität von Texten grundlegend, und damit auch die Art, wie auf sie Bezug zu nehmen ist. Dieser Übergang ist nicht frei von Problemen, die dadurch noch größer werden, dass die Bezugnahme auch wechselseitig zwischen den Welten des Drucks und der elektronischen Repräsentation möglich sein soll. Weiterlesen „Zitieren im digitalen Medium“

Philosophy meets Robotics

„Philosophy meets Robotics“ war der Titel der „8th European Conference on Computing and Philosophy“. zu der Gäste von Schweden bis Türkei, Portugal bis Russland, aber auch aus China, Japan, Israel, Südamerika und USA kamen. Das inhaltliche Spektrum war ähnlich breit gefächert: Philosophy of Computer Science, Information and Cognition, Robotics, AI and Cognitive Systems, Computational Neurosciences of Emotion and Consciousness, Computational Approaches to Thought and Action, um nur einen Bruchteil zu nennen. Wie meist bei Kongressen nutze ich den Blog nur, um meinen eigenen Beitrag vorzustellen. (Die anderen sollte man über obige Webseite der Konferenz finden. Derzeit finde ich allerdings keine elektronische Variante der Kongressakten – angesichts des Themas etwas verwunderlich!) Was auch schon Tradition hat: meinen Beitrag gibt es in schriftlicher Form gar nicht. Die Fassung für die Akten ist schon veraltet und enthält die interessantesten Passagen nicht. Die vorgetragene Fassung habe ich nur als Präsentation, aus der man ohne Erläuterung wahrscheinlich nicht schlau wird.