26.03.2020 | Digitaler Datenschatz

VON PEST BIS LUFTFAHRT: PER MAUSKLICK IN DIE ZEITUNG DES 18. JAHRHUNDERTS

Das Wien[n]erische Diarium ist die älteste Tageszeitung der Welt, die bis heute als Wiener Zeitung existiert. Sie bietet eine lückenlose Quelle über 300 Jahre Zeitgeschehen. Drei Jahre lang haben sich Forscher/innen der Österreichischen Akademie der Wissenschaften der digitalen Transformation dieses Datenschatzes gewidmet. Mehr als 300 Ausgaben aus dem 18. Jahrhundert sind jetzt im Volltext digitalisiert und online durchsuchbar.

© APA-Fotoservice/Schedl/ÖAW

Es wird verlautbart, dass „wegen der in Frankreich grassirenden Pest / weder Personen / Vieh / noch Waaren / von dorten“ einreisen dürften. Auch heißt es andernorts, dass „allda niemand Frembder / ohne sichern Paß / wegen der anderwerts im Schwung gehenden bösen Seuche / eingelassen werde“. Was in Zeiten von Corona unangenehm vertraut klingt, entstammt einem Datenschatz, der über 300 Jahre in die Vergangenheit zurückreicht: dem digitalen Diarium - kurz Digitarium -, der digitalisierten Sammlung der historischen Ausgaben des Wien[n]erischen Diariums.

Wie ein Klick in die online veröffentlichten Sammlungsbestände zeigt, wurden Pandemien auch im 18. Jahrhundert als existenzielle Bedrohung wahrgenommen. Konkret fanden sie in Gestalt des Überbegriffs der Pest regelmäßig und zahlreiche Erwähnung im Wie[n]erischen Diarium. Die Meldungen aus unterschiedlichen Regionen und Zeiten erlauben aufschlussreiche Einblicke in die Art und Weise, wie man früher mit derartigen Pandemien umgegangen ist. Zugänglich gemacht wurden diese und viele weitere Meldungen von anno dazumal in einem seit 2017 laufenden Forschungsprojekt an der Österreichischen Akademie der Wissenschaften (ÖAW). Im Rahmen dieses Projekts haben Wiener Forscher/innen die Webapplikation Digitarium entwickelt. Hier sind nun bereits zahlreiche digitalisierte Ausgaben online.

Bedeutendstes Medium der Habsburgermonarchie

„Im gesamten 18. Jahrhundert sind etwa 10.000 Nummern des Wien[n]erischen Diariums erschienen“, erzählt Projektleiterin Claudia Resch, Germanistin am Austrian Centre for Digital Humanities and Cultural Heritage der ÖAW. Gemeinsam mit Anna Mader-Kratky vom ÖAW-Institut für die Erforschung der Habsburgermonarchie und des Balkanraumes und einem interdisziplinären Projektteam digitalisierte sie mehr als 300 Ausgaben des Diariums und erschloss diese wissenschaftlich – das entspricht etwa 6.000 Seiten beziehungsweise drei Millionen Wörtern.

Die Bandbreite der Themen im Wie[n]erischen Diarium ist mit jener heutiger Zeitungen durchaus vergleichbar. So ging es nicht nur um Pest und Seuchen. Der Baufortschritt der Wiener Hofburg im Spiegel der Berichterstattung lässt sich über die Jahrzehnte hinweg genauso recherchieren, wie der Beginn der Luftfahrt, die Entwicklung der Schriftsprache oder die Gestaltung von Inseraten im Zeitverlauf. Das Wien[n]erische Diarium, gegründet 1703 und 1780 in Wiener Zeitung umbenannt, gilt nicht umsonst als bedeutendstes Medium der Habsburgermonarchie, in dem sich die Anfänge des modernen Journalismus widerspiegeln. Heute ist es eine reiche Quelle für Geschichtsinteressierte und die Wissenschaft.


Smarte Daten durch lernfähige Software

Um diese Vielfalt zugänglich zu machen, sind die digitalisierten Ausgaben der Tageszeitung in der Webapplikation nach beliebigen Begriffen durchsuchbar, etwa nach historischen Ereignissen, Personen oder Orten. Denn: Alle digitalisierten Nummern stehen auch im Volltext zur Verfügung. Und dieser ist außergewöhnlich präzise.

Während bei anderen Projekten zur Digitalisierung von Zeitungen die Inhalte maschinell mit herkömmlichen Methoden der Optischen Zeichenerkennung (OCR) erfasst werden, entschied man sich beim Digitarium erstmals für die Verwendung von selbstlernenden, sogenannten „Handwritten Text Recognition“-Technologien – und hat damit überraschend erfolgreiche Ergebnisse erzielt. „Man muss dieses Tool Schritt für Schritt lehren, wie es die Daten einlesen soll. Je mehr manuell korrigiertes Material aus dem Diarium darin enthalten ist, desto bessere Ergebnisse erzielt man allmählich mit dem Modell, das dabei trainiert wird“, erzählt Resch.

Textgenauigkeit bei fast 100 Prozent

Der Einsatz dieser lernfähigen Software und viele Korrekturdurchgänge durch das menschliche Auge haben sich jedenfalls gelohnt: Die Textgenauigkeit beträgt nun 99,7 Prozent. Die sorgfältig überprüften „smarten“ und qualitativ hochwertigen Daten tragen wiederum dazu bei, dass weitere Ausgaben verbessert eingelesen werden können. Resch: „Die Forschung braucht verlässlichere Texte und zeichengenaue Transkriptionen, in denen jedes Wort dem historischen Sprachstand gemäß korrekt wiedergegeben und damit auffindbar ist.“

Und durch die moderne Technik finden Leser/innen heute auch hoffnungsvolle Meldungen von damals. So steht am 11. November 1722 im Diarium: „daß die Seuche an allen Orten von Provence und Languedoc völlig aufgehört / und […] daß jene Stadt / in welcher dieselbe so sehr gewütet / nunmehro davon befreyet seye.“

 

Auf einen Blick

Digitarium