23.05.2023 | KI in der Forschung

ChatGPT kann nicht Geschichte schreiben

ChatGPT und andere künstliche Intelligenzen können für Historiker:innen ein sinnvolles Werkzeug sein. Eine Konkurrenz für die Geschichtsschreibung durch den Menschen sind sie aber nicht, sagt ÖAW-Historiker Johannes Preiser-Kapeller.

© Adobe Stock

Der Einsatz von künstlicher Intelligenz (KI) schreitet auch in der Forschung massiv voran. Längst betrifft das nicht nur die Naturwissenschaften. Auch in den Geschichtswissenschaften werden KI-Systeme inzwischen verwendet, etwa zum Übersetzen historischer Texte oder - wie etwa mit dem Programm Transkribus - zum Entziffern alter Handschriften, dessen Vorteile vor Kurzem bei einer Konferenz an der ÖAW präsentiert wurden. 

Johannes Preiser-Kapeller, Byzanzforscher am Institut für Mittelalterforschung der Österreichischen Akademie der Wissenschaften (ÖAW), ist ein kritischer Pionier beim Einsatz von digitalen Instrumenten zur Analyse von historischen Daten und wurde vor kurzem zur Nutzung von künstlicher Intelligenz in diesem Bereich für die “ Technology Review” des Massachusetts Institute of Technology (MIT) interviewt.

Welche Chancen und Risiken er für den Einsatz von KI-Systemen in der Geschichtsforschung sieht, erzählt er im Gespräch. Eines ist für ihn dabei klar: „KI kann als Werkzeug wertvoll sein, den Menschen aber nicht ersetzen.“

GROSSE DATENMENGEN SCHNELLER NUTZBAR

Warum sind KI-Systeme gerade für Historiker:innen so interessant?

Johannes Preiser-Kapeller: Forscher:innen verwenden Werkzeuge mit KI-Elementen so wie andere Nutzer:innen auch, etwa zum automatischen Übersetzen von Texten aus anderen Sprachen. Speziellere Programme können zusätzlich bei der Übersetzung historischer Texte oder sogar der Ergänzung von Textfragmenten helfen. Moderne Bild- und Mustererkennung kann auch dazu beitragen, schwer lesbare Handschriften zu entziffern, zum Teil auch schon automatisch. KI kann es ermöglichen, große Datenmengen über Gesellschaften schneller als bisher für die Forschung nutzbar zu machen. 

KI kann es ermöglichen, große Datenmengen über Gesellschaften schneller als bisher für die Forschung nutzbar zu machen. 

Wie lange sind KI-Systeme für Historiker:innen schon ein Thema?

Preiser-Kapeller: Schon länger. Das KI-basierte Unterfangen “Time Machine Europe” war sogar ein Kandidat für ein europäisches “Flagship Project“. Diese Projektidee Projekt begann 2013 mit der Time Machine Venice. In Venedig gibt es eines der größten Archive Europas mit historischen Texten, die in großen Teilen noch nicht entziffert sind. Einzelne Bereiche dieser Sammlung wurden digitalisiert, mit KI-Systemen lesbar gemacht und dann durchforstet, um zum Beispiel Informationen über Verbindungen zwischen einzelnen Personen aus den Dokumenten zu extrahieren. Man wollte das soziale Gefüge der Stadt vom Mittelalter bis in die Gegenwart rekonstruieren und sogar Prognosen über die künftige Entwicklung der Gesellschaft daraus ableiten. Dasselbe sollte auf europäischer Ebene dann auch passieren, für alle großen Archive des Kontinents. Dabei sollten auch Kartenmaterial und historische Abbildungen eingescannt werden, um die Entwicklung des Stadtbildes wichtiger Orte in 4 D (3D-Modelle plus Zeit, Anm.) nachzuvollziehen.

KI kann derzeit zwar helfen, die Daten grob zu filtern, aber ohne die Einordnung durch Expert:innen ist das kaum sinnvoll.

Läuft das Projekt noch?

Preiser-Kapeller: Es gibt nach wie vor ein Konsortium, das an der Time Machine Europe arbeitet, auch mit österreichischer Beteiligung. Der Schwerpunkt liegt derzeit auf der Digitalisierung von Dokumenten und Abbildungen sowie der Visualisierung . Aber die ganz großen Pläne, die für eine „Spiegelung“ der europäischen Vergangenheit in der virtuellen Welt und daraus abgeleiteten Zukunftsprognosen entworfen wurden, wurden nicht umgesetzt, auch weil die Idee der mit massiven Geldmitteln geförderten Flagshipprojekte in der EU insgesamt mittlerweile kritisch gesehen wird. Zudem gab es 2019 Streit im Rahmen des ursprünglichen Projektes in Venedig, weil die dortigen Archivare angaben, dass nur zum Teil brauchbare Informationen geliefert wurden. 

AUTOMATISIERUNG HAT GRENZEN

Die KI-Systeme konnten also nicht halten, was versprochen wurde?

Allein im Archiv von Venedig liegen aber Dokumente aus 1.000 Jahren.

Preiser-Kapeller: Ein Problem war offenbar, dass die erstellten Metadaten, die den Kontext für die gewonnenen Daten liefern sollten, ungenügend waren. Insgesamt kann KI derzeit zwar helfen, die Daten grob zu filtern, aber ohne die Einordnung durch Expert:innen ist das kaum sinnvoll. Nur weil zwei Namen in einem automatisch gelesenen Text vorkommen, bedeutet das ja nicht immer, dass die Personen etwas miteinander zu tun hatten. Das wird bei einer simplen automatisierten Netzwerkanalyse aber nicht berücksichtigt. Wenn zwei Personen in einem Ehevertrag auftauchen, ist das etwas ganz anderes, als wenn sie beide mit Dutzenden anderen in einer Steuerliste stehen. Nach einem so spezifischen Kontext konnte die KI aber nicht filtern.

Zudem benötigen solche Systeme brauchbare Trainingsdaten in großen Mengen, also etwa bereits entzifferte Dokumente, um daraus zu lernen, weitere Texte in vergleichbarer Schrift zu lesen. Allein im Archiv von Venedig liegen aber Dokumente aus 1.000 Jahren. In dieser Zeit hat sich auch die Schrift selbst stark verändert. Um einer KI zu ermöglichen, solche verschiedenartigen Handschriften zu lesen, müssen Menschen die Daten zuerst in großer Zahl aufbereiten. So „automatisiert“, wie man sich das vielleicht vorstellt, ist der Prozess also in der Aufbauphase bei weitem nicht.

Gibt es einen Platz für KI in der Geschichtsforschung?

Preiser-Kapeller: Ein Mensch liest sich in einen Bestand von historischen Quellen ein und er macht sich dabei intensiv mit Kontext, Inhalt und Schrift vertraut. Das kann eine Maschine noch nicht. Aber die Fortschritte sind trotzdem beeindruckend. Die Texterkennung zum Beispiel wird immer besser. Mit Transkribus wurde an der Universität Innsbruck eine interessante Lösung entwickelt, die – nach dem Training durch Spezialist:innen – Handschriften lesbar und digital durchsuchbar macht.

KI kann als Werkzeug wertvoll sein, den Menschen aber nicht ersetzen.

Für die historische Forschung ist aber vor allem die Fragestellung wichtig und die bleibt sicher auch in Zukunft in der Hand der Historiker:innen. Bis vor einigen Jahrzehnten gab es für Themen wie Frauen- und Geschlechtergeschichte oder Umwelt- und Klimageschichte kaum Platz in der Forschung. Heute ist das anders und unter sich auch aufgrund gesellschaftlicher Entwicklungen ändernden Perspektiven können dieselben Dokumente mit anderen Fragestellungen immer wieder angegangen werden. KI kann als Werkzeug wertvoll sein, den Menschen aber nicht ersetzen.

COMPUTER SIND NICHT UNPARTEIISCH

In letzter Zeit haben KI-Systeme viele Schlagzeilen gemacht. Haben Sie ChatGPT schon probiert?

Preiser-Kapeller: Ja. Für alle, die an der Universität oder anderswo unterrichten, ist natürlich die interessante Frage, ob man einen von Studierenden als eigene Arbeit eingereichten GPT-Text erkennen würde. Ich habe dem System einige typische Arbeitsaufgaben aus meinen Kursen gestellt. Die KI ist auf den ersten Blick recht gut bei allgemeinen Fragen. Die Antworten sind gut formuliert; bei näherem Hinsehen sind sie aber aber oft oberflächlich, ähnlich wie bei Studierenden, die das Material nur schnell überflogen haben und dies durch Gemeinplätze zu kaschieren versuchen. Wenn man Detailfragen stellt, werden die Antworten schnell irrig. Das System hat etwa große Probleme bei namensgleichen Persönlichkeiten, die um die selbe Zeit gelebt haben; da werden dann Details aus verschiedenen Biographien zu immer wieder auf andere Weise falschen Antworten zusammengewürfelt.

Unterbelichtet bleibt oft der enorme Einsatz an menschlicher Arbeitskraft, den die Erstellung von Trainingsdaten erfordert. Dabei werden auch Menschen in Billiglohnländern ausgenutzt, um Daten zu kategorisieren.

Welche kritischen Aspekte von KI-Systemen müssten noch stärker beleuchtet werden?

Preiser-Kapeller: Unterbelichtet bleibt oft der enorme Einsatz an menschlicher Arbeitskraft, den die Erstellung von Trainingsdaten erfordert. Dabei werden auch Menschen in Billiglohnländern ausgenutzt, um Daten zu kategorisieren. Eine weitere Frage ist, welche Trainingsdaten verwendet werden und wie darin bereits bestehende Ungleichgewichte in der Repräsentanz von verschiedenen Gruppen, Themen und so weiter auch die Ergebnisse der Arbeit der KI beeinflussen. In der Vergangenheit hatten zum Beispiel Systeme zur automatischen Bilderkennung Probleme bei der Identifikation von Afroamerikaner:innen, weil die Masse der Trainingsdaten nur bestimmte ethnische Gruppen zeigte. Derartige Verzerrungsphänomene sind gerade Historiker:innen aus der Arbeit an ihren Quellen vertraut, aber bei KI-Systemen geht man oft irrig vom Idealbild eines „unparteiischen“ Computers aus. Und schließlich stellt sich natürlich die Frage, wer von KI-Systemen ökonomisch und machtpolitisch profitiert und ob sie genutzt werden, um ökonomische oder soziale Ungleichheit oder Unterdrückung zu vergrößern.

 

AUF EINEN BLICK

Johannes Preiser-Kapeller lehrt Byzantinistik und Globalgeschichte an der Universität Wien und ist wissenschaftlicher Mitarbeiter am Institut für Mittelalterforschung der Österreichischen Akademie der Wissenschaften (ÖAW), wo er den Forschungsbereich „Byzanz im Kontext“ leitet. Auf Twitter ist er als @Byzanzforscher aktiv.