ChatGPT kann nicht Geschichte schreiben

ChatGPT und andere künstliche Intelligenzen können für Historiker:innen ein sinnvolles Werkzeug sein. Eine Konkurrenz für die Geschichtsschreibung durch den Menschen sind sie aber nicht, sagt ÖAW-Historiker Johannes Preiser-Kapeller.

23.05.2023

Der Einsatz von künstlicher Intelligenz (KI) schreitet auch in der Forschung massiv voran. Längst betrifft das nicht nur die Naturwissenschaften. Auch in den Geschichtswissenschaften werden KI-Systeme inzwischen verwendet, etwa zum Übersetzen historischer Texte oder - wie etwa mit dem Programm Transkribus - zum Entziffern alter Handschriften, dessen Vorteile vor Kurzem bei einer Konferenz an der ÖAW präsentiert wurden.

Johannes Preiser-Kapeller, Byzanzforscher am Institut für Mittelalterforschung der Österreichischen Akademie der Wissenschaften (ÖAW), ist ein kritischer Pionier beim Einsatz von digitalen Instrumenten zur Analyse von historischen Daten und wurde vor kurzem zur Nutzung von künstlicher Intelligenz in diesem Bereich für die “ Technology Review” des Massachusetts Institute of Technology (MIT) interviewt.

Welche Chancen und Risiken er für den Einsatz von KI-Systemen in der Geschichtsforschung sieht, erzählt er im Gespräch. Eines ist für ihn dabei klar: „KI kann als Werkzeug wertvoll sein, den Menschen aber nicht ersetzen.“

GROSSE DATENMENGEN SCHNELLER NUTZBAR

Warum sind KI-Systeme gerade für Historiker:innen so interessant?

Johannes Preiser-Kapeller: Forscher:innen verwenden Werkzeuge mit KI-Elementen so wie andere Nutzer:innen auch, etwa zum automatischen Übersetzen von Texten aus anderen Sprachen. Speziellere Programme können zusätzlich bei der Übersetzung historischer Texte oder sogar der Ergänzung von Textfragmenten helfen. Moderne Bild- und Mustererkennung kann auch dazu beitragen, schwer lesbare Handschriften zu entziffern, zum Teil auch schon automatisch. KI kann es ermöglichen, große Datenmengen über Gesellschaften schneller als bisher für die Forschung nutzbar zu machen.

KI kann es ermöglichen, große Datenmengen über Gesellschaften schneller als bisher für die Forschung nutzbar zu machen.

Wie lange sind KI-Systeme für Historiker:innen schon ein Thema?

Preiser-Kapeller: Schon länger. Das KI-basierte Unterfangen “Time Machine Europe” war sogar ein Kandidat für ein europäisches “Flagship Project“. Diese Projektidee Projekt begann 2013 mit der Time Machine Venice. In Venedig gibt es eines der größten Archive Europas mit historischen Texten, die in großen Teilen noch nicht entziffert sind. Einzelne Bereiche dieser Sammlung wurden digitalisiert, mit KI-Systemen lesbar gemacht und dann durchforstet, um zum Beispiel Informationen über Verbindungen zwischen einzelnen Personen aus den Dokumenten zu extrahieren. Man wollte das soziale Gefüge der Stadt vom Mittelalter bis in die Gegenwart rekonstruieren und sogar Prognosen über die künftige Entwicklung der Gesellschaft daraus ableiten. Dasselbe sollte auf europäischer Ebene dann auch passieren, für alle großen Archive des Kontinents. Dabei sollten auch Kartenmaterial und historische Abbildungen eingescannt werden, um die Entwicklung des Stadtbildes wichtiger Orte in 4 D (3D-Modelle plus Zeit, Anm.) nachzuvollziehen.

KI kann derzeit zwar helfen, die Daten grob zu filtern, aber ohne die Einordnung durch Expert:innen ist das kaum sinnvoll.

Läuft das Projekt noch?

Preiser-Kapeller: Es gibt nach wie vor ein Konsortium, das an der Time Machine Europe arbeitet, auch mit österreichischer Beteiligung. Der Schwerpunkt liegt derzeit auf der Digitalisierung von Dokumenten und Abbildungen sowie der Visualisierung . Aber die ganz großen Pläne, die für eine „Spiegelung“ der europäischen Vergangenheit in der virtuellen Welt und daraus abgeleiteten Zukunftsprognosen entworfen wurden, wurden nicht umgesetzt, auch weil die Idee der mit massiven Geldmitteln geförderten Flagshipprojekte in der EU insgesamt mittlerweile kritisch gesehen wird. Zudem gab es 2019 Streit im Rahmen des ursprünglichen Projektes in Venedig, weil die dortigen Archivare angaben, dass nur zum Teil brauchbare Informationen geliefert wurden.

AUTOMATISIERUNG HAT GRENZEN

Die KI-Systeme konnten also nicht halten, was versprochen wurde?

Allein im Archiv von Venedig liegen aber Dokumente aus 1.000 Jahren.

Preiser-Kapeller: Ein Problem war offenbar, dass die erstellten Metadaten, die den Kontext für die gewonnenen Daten liefern sollten, ungenügend waren. Insgesamt kann KI derzeit zwar helfen, die Daten grob zu filtern, aber ohne die Einordnung durch Expert:innen ist das kaum sinnvoll. Nur weil zwei Namen in einem automatisch gelesenen Text vorkommen, bedeutet das ja nicht immer, dass die Personen etwas miteinander zu tun hatten. Das wird bei einer simplen automatisierten Netzwerkanalyse aber nicht berücksichtigt. Wenn zwei Personen in einem Ehevertrag auftauchen, ist das etwas ganz anderes, als wenn sie beide mit Dutzenden anderen in einer Steuerliste stehen. Nach einem so spezifischen Kontext konnte die KI aber nicht filtern.

Zudem benötigen solche Systeme brauchbare Trainingsdaten in großen Mengen, also etwa bereits entzifferte Dokumente, um daraus zu lernen, weitere Texte in vergleichbarer Schrift zu lesen. Allein im Archiv von Venedig liegen aber Dokumente aus 1.000 Jahren. In dieser Zeit hat sich auch die Schrift selbst stark verändert. Um einer KI zu ermöglichen, solche verschiedenartigen Handschriften zu lesen, müssen Menschen die Daten zuerst in großer Zahl aufbereiten. So „automatisiert“, wie man sich das vielleicht vorstellt, ist der Prozess also in der Aufbauphase bei weitem nicht.

Gibt es einen Platz für KI in der Geschichtsforschung?

Preiser-Kapeller: Ein Mensch liest sich in einen Bestand von historischen Quellen ein und er macht sich dabei intensiv mit Kontext, Inhalt und Schrift vertraut. Das kann eine Maschine noch nicht. Aber die Fortschritte sind trotzdem beeindruckend. Die Texterkennung zum Beispiel wird immer besser. Mit Transkribus wurde an der Universität Innsbruck eine interessante Lösung entwickelt, die – nach dem Training durch Spezialist:innen – Handschriften lesbar und digital durchsuchbar macht.

KI kann als Werkzeug wertvoll sein, den Menschen aber nicht ersetzen.

Für die historische Forschung ist aber vor allem die Fragestellung wichtig und die bleibt sicher auch in Zukunft in der Hand der Historiker:innen. Bis vor einigen Jahrzehnten gab es für Themen wie Frauen- und Geschlechtergeschichte oder Umwelt- und Klimageschichte kaum Platz in der Forschung. Heute ist das anders und unter sich auch aufgrund gesellschaftlicher Entwicklungen ändernden Perspektiven können dieselben Dokumente mit anderen Fragestellungen immer wieder angegangen werden. KI kann als Werkzeug wertvoll sein, den Menschen aber nicht ersetzen.

COMPUTER SIND NICHT UNPARTEIISCH

In letzter Zeit haben KI-Systeme viele Schlagzeilen gemacht. Haben Sie ChatGPT schon probiert?

Preiser-Kapeller: Ja. Für alle, die an der Universität oder anderswo unterrichten, ist natürlich die interessante Frage, ob man einen von Studierenden als eigene Arbeit eingereichten GPT-Text erkennen würde. Ich habe dem System einige typische Arbeitsaufgaben aus meinen Kursen gestellt. Die KI ist auf den ersten Blick recht gut bei allgemeinen Fragen. Die Antworten sind gut formuliert; bei näherem Hinsehen sind sie aber aber oft oberflächlich, ähnlich wie bei Studierenden, die das Material nur schnell überflogen haben und dies durch Gemeinplätze zu kaschieren versuchen. Wenn man Detailfragen stellt, werden die Antworten schnell irrig. Das System hat etwa große Probleme bei namensgleichen Persönlichkeiten, die um die selbe Zeit gelebt haben; da werden dann Details aus verschiedenen Biographien zu immer wieder auf andere Weise falschen Antworten zusammengewürfelt.

Unterbelichtet bleibt oft der enorme Einsatz an menschlicher Arbeitskraft, den die Erstellung von Trainingsdaten erfordert. Dabei werden auch Menschen in Billiglohnländern ausgenutzt, um Daten zu kategorisieren.

Welche kritischen Aspekte von KI-Systemen müssten noch stärker beleuchtet werden?

Preiser-Kapeller: Unterbelichtet bleibt oft der enorme Einsatz an menschlicher Arbeitskraft, den die Erstellung von Trainingsdaten erfordert. Dabei werden auch Menschen in Billiglohnländern ausgenutzt, um Daten zu kategorisieren. Eine weitere Frage ist, welche Trainingsdaten verwendet werden und wie darin bereits bestehende Ungleichgewichte in der Repräsentanz von verschiedenen Gruppen, Themen und so weiter auch die Ergebnisse der Arbeit der KI beeinflussen. In der Vergangenheit hatten zum Beispiel Systeme zur automatischen Bilderkennung Probleme bei der Identifikation von Afroamerikaner:innen, weil die Masse der Trainingsdaten nur bestimmte ethnische Gruppen zeigte. Derartige Verzerrungsphänomene sind gerade Historiker:innen aus der Arbeit an ihren Quellen vertraut, aber bei KI-Systemen geht man oft irrig vom Idealbild eines „unparteiischen“ Computers aus. Und schließlich stellt sich natürlich die Frage, wer von KI-Systemen ökonomisch und machtpolitisch profitiert und ob sie genutzt werden, um ökonomische oder soziale Ungleichheit oder Unterdrückung zu vergrößern.

AUF EINEN BLICK

Johannes Preiser-Kapeller lehrt Byzantinistik und Globalgeschichte an der Universität Wien und ist wissenschaftlicher Mitarbeiter am Institut für Mittelalterforschung der Österreichischen Akademie der Wissenschaften (ÖAW), wo er den Forschungsbereich „Byzanz im Kontext“ leitet. Auf Twitter ist er als @Byzanzforscher aktiv.

Name	Funktion	Speicherdauer	Typ	Anbieter
CookieConsent	Speichert Ihre Einwilligung zur Verwendung von Cookies.	1 Jahr	HTML	Web Consent
fe_typo_user	Ordnet Ihren Browser einer Session auf dem Server zu. Dies beeinflusst nur die Inhalte, die Sie sehen und wird von uns nicht ausgewertet oder weiterverarbeitet.	-	HTTP	Web User

Name	Funktion	Speicherdauer	Typ	Anbieter
_pk_id	Wird verwendet, um ein paar Details über den Benutzer wie die eindeutige Besucher-ID zu speichern.	13 Monate	HTML	Matomo-id
_pk_ref	Wird benutzt, um die Informationen der Herkunftswebsite des Benutzers zu speichern.	6 Monate	HTML	Matomo-ref
_pk_ses	Kurzzeitiges Cookie, um vorübergehende Daten des Besuchs zu speichern.	30 Minuten	HTML	Matomo-ses
_pk_cvar	Kurzzeitiges Cookie, um vorübergehende Daten des Besuchs zu speichern.	30 Minuten	HTML	Matomo-cvar
_pk_hsr	Kurzzeitiges Cookie, um vorübergehende Daten des Besuchs zu speichern.	30 Minuten	HTML	Matomo

Name	Funktion	Speicherdauer	Typ	Anbieter
YouTube	Es wird eine Verbindung mit YouTube hergestellt, um Videos anzuzeigen.	-	Verbindung	YouTube
SoundCloud	Es wird eine Verbindung mit SoundCloud hergestellt, um Audio-Dateien abzuspielen.	-	Verbindung	SoundCloud
Twitter	Es wird eine Verbindung mit Twitter hergestellt, um Tweets anzuzeigen.	-	missing translation: type.	Twitter
_cs_c	Zeigt an, ob der Nutzer dem Tracking durch ContentSquare zugestimmt hat.	394 Tage	missing translation: type.	Spotify (ContentSquare)
_cs_id	Speichert eine eindeutige Benutzer-ID für die Analyse durch ContentSquare.	394 Tage	missing translation: type.	Spotify (ContentSquare)
_ga	Wird verwendet, um Benutzer zu unterscheiden.	400 Tage	missing translation: type.	Google Analytics
_ga_BMC5VGR8YS	Dient Google Analytics zur Aufrechterhaltung des Sitzungsstatus.	400 Tage	missing translation: type.	Google Analytics
_ga_S0T2DJJFZM	Dient Google Analytics zur Aufrechterhaltung des Sitzungsstatus.	399 Tage	missing translation: type.	Google Analytics
_ga_ZWG1NSHWD8	Dient Google Analytics zur Aufrechterhaltung des Sitzungsstatus.	400 Tage	missing translation: type.	Google Analytics
_ga_ZWRF3NLZJZ	Dient Google Analytics zur Aufrechterhaltung des Sitzungsstatus.	400 Tage	missing translation: type.	Google Analytics
_gid	Wird verwendet, um Benutzer zu unterscheiden.	1 Tage	missing translation: type.	Google Analytics
_ScCbts	Speichert temporäre Sitzungs- oder Wiedergabeeinstellungen.	6 Tage	missing translation: type.	Spotify
_scid	Spotify-Werbe-ID für Analyse und Remarketing.	395 Tage	missing translation: type.	Spotify
_scid_r	Spotify-Werbe-ID für Analyse und Remarketing.	395 Tage	missing translation: type.	Spotify
eupubconsent-v2	Speichert die IAB-Zustimmungsinformationen gemäß dem TCF.	364 Tage	missing translation: type.	IAB / Spotify
OptanonAlertBoxClosed	Speichert, ob der Cookie-Hinweis geschlossen wurde.	364 Tage	missing translation: type.	OneTrust
OptanonConsent	Speichert die Zustimmungseinstellungen, die über OneTrust gesetzt wurden.	365 Tage	missing translation: type.	OneTrust
sp_adid	Werbekennung von Spotify für Tracking und Personalisierung.	365 Tage	missing translation: type.	Spotify
sp_landing	Zeichnet auf, welche Spotify-Seite zuerst besucht wurde.	1 Tage	missing translation: type.	Spotify
sp_m	Speichert die Marktregion des Nutzers.	399 Tage	missing translation: type.	Spotify
sp_t	Sitzungstoken für Spotify-Wiedergabe und Zugriff.	365 Tage	missing translation: type.	Spotify

ChatGPT kann nicht Geschichte schreiben

GROSSE DATENMENGEN SCHNELLER NUTZBAR

AUTOMATISIERUNG HAT GRENZEN

COMPUTER SIND NICHT UNPARTEIISCH

AUF EINEN BLICK

ChatGPT: „Vor der allwissenden KI brauchen wir uns noch nicht zu fürchten“