
Transkribus ist eine Plattform zur automatisierten Transkription historischer Handschriften und Drucke. Sie wurde an der Universität Innsbruck entwickelt und bietet Nutzer:innen eine Reihe von Tools und Unterstützung aus der mittlerweile weit über 100.000 User:innen umfassenden Community, die stetig neue Modelle veröffentlicht und zur Nachnutzung zur Verfügung stellt.
Transkribus an der ÖAW
Transkribus wird bereits an mehreren Instituten der Österreichischen Akademie der Wissenschaften erfolgreich zur Text- und Layout-Erkennung eingesetzt. Forscher:innen aus zahlreichen Fachdisziplinen arbeiten in verschiedenen Projektkontexten und machen von verschiedenen Komponenten der Transkribus-Toolsuite Gebrauch. Das ACDH führt User:innen der Transkribus-Plattform an der ÖAW zusammen: Verbindend wirkt dabei vor allem der Wissenstransfer zwischen den ÖAW-Instituten, der Austausch über neueste Entwicklungen der Plattform sowie die interdisziplinäre Reflexion über den Einsatz von KI innerhalb der digitalen Geisteswissenschaften.
Transkribus-Koordinator:innen an der ÖAW

Austrian Centre for Digital Humanities
Abteilung Musikwissenschaft

Austrian Centre for Digital Humanities
Abteilung Literatur- & Textwissenschaft

News
Anfang 2024 stellte die Read Coop dem Austrian Centre for Digital Humanities 30.000 Transkribus-Credits zur Verfügung. Das ACDH rief daraufhin speziell Nachwuchswissenschaftler:innen auf, Transkriptionsprojekte einzureichen, die mit diesen Credits unterstützt werden können. Bedingung für die Unterstützung war die Bereitschaft, nach FAIR-Prinzipien zu arbeiten.
Deadline für die Einreichungen war der 15. März 2025. Im April gingen die Credits an:
- William Godsey / IHB: 5.000 Credits für Transkriptionen im Projekt "Dynastic Continuity in an Age of Crisis? The Habsburgs in the Revolutionary and Napoleonic Wars (1792-1815)"
- Jan Odstrcilik / IMAFO: 5.000 Credits für Transkriptionen der Predigten von Heinrich Totting von Oyta
- Yasir Yilmaz / IHB: 1.500 Credits für Transkriptionen im Projekt "The Ottoman Grand Vizierate 1560s to 1760s (GraViz)"
Transkribus-Veranstaltungen
Bevorstehend:
Zurzeit gibt es keine bevorstehenden Transkribus-Veranstaltungen an der ÖAW.
Archiv:
- 18. Juni 2025: Transkribus Experts Meeting
- 30. April 2025: ACDH-CH Tool Gallery 11.2 (für Anfänger:innen)
- 6. März 2024: ACDH-CH Tool Gallery 10.1 (für Anfänger:innen)
- 15.-16. Februay 2024: Transkribus User Conference Innsbruck (unter Beteiligung von ÖAW-Mitarbeiter:innen)
- 8. November 2023: ACDH-CH Tool Gallery 9.3 (für Fortgeschrittene)
- 7. November 2023-30. Jänner 2024: Winter school of Handwritten Text Recognition of Medieval Manuscripts (IMAFO)
- 14. Juni 2023: ACDH-CH Tool Gallery 9.2 (für Anfänger:innen)
- 18. April 2023: ACDH-CH Forschungstag "Transkribus: Unlocking our written past"
- 19. Mai 2022: 1. Vernetzungstreffen
Transkribus-Projekte an der ÖAW
Digitale Erschließung der Rechnungsbücher des Klosters Aldersbach
Team: Robert Klugseder (PI), Magdalena Rufin, Johanna Maria Unterholzner
Institut/Institutionen: ACDH, Universität Graz, Know Center Graz, Universität Regensburg
Finanzierung: FWF, DFG (Weave-Programm)
Projektlaufzeit: Mai 2024–Dez. 2027
Digitale Edition und Analyse von rund 20 deutsch- und lateinischsprachigen Rechnungsbüchern aus dem 15. und 16. Jahrhundert. Automatische Texttranskription mit Layout- und Textmodelltraining.
ARITHMETIC - German Arithmetical Treatises in Manuscripts of the Late Middle Ages (1400-1522)
Team: Michaela Wiesinger (PI), Christina Jackel, Norbert Orban, Franziska Putz, Bernhard Bauer
Institut: IMAFO
Finanzierung: ERC
Projektlaufzeit: Bis September 2027
Arbeit an einer "Assertive Edition" der Texte. Rund 140 Primärquellen werden mithilfe von Transkribus transkribiert und eigene HTR-Modelle generiert. Erste Annotationen werden ebenfalls in der Software durchgeführt, bevor XML-Dateien zur weiteren Berbeitung exportiert werden.
Arthur Schnitzler – Kritische Edition (Frühwerk) IV
PI: Konstanze Fliedl
Institut: ACDH
Finanzierung: FWF
Projektlaufzeit: Bis Mai 2025
Für die historisch-kritische Ausgabe werden primär relevante Drucktexte (Erstdrucke und Erstausgaben) sowie Materialien aus dem Nachlass eingelesen. Drucke und Typoskripte werden mit OCR gelesen und anschließend kollationiert, während Handschriften in Transkribus manuell transkribiert werden. Anschließend werden die Texte als XML exportiert.
Arthur Schnitzler: Archiv der Zeitungsausschnitte
Team: Peter Andorfer, Martin Anton Müller, Ingo Börner
Institut: ACDH
Finanzierung: various
Projektlaufzeit: Sept.–Okt. 2019
Automatische Erkennung von Mikrofiche-Scans. Die Website spiegelt derzeit über die API den Transkribus-Server einschließlich der Bilder.
Auden in Austria Digital (AAD)
Team: Sandra Mayer (PI), Timo Frühwirth
Institut: ACDH
Finanzierung: FWF
Projektlaufzeit: 2024–2027
Training eines (in der Folge öffentlich zu machenden) Modells für die ,späte‘ Handschrift von W. H. Auden (das heißt, im Zeitraum 1958–1973) sowie Anwendung öffentlicher Modelle für englische und deutschsprachige Schreibmaschinen- und Druckschrift.
Clara Katharina Pollaczek: Arthur Schnitzler und ich.
Team: Martin Anton Müller (PI), Laura Untner
Institut: ACDH
Finanzierung: FWF
Projeklaufzeit: Nov 2022–Jan 2023
Automatische Erkennung des Typoskripts. Crowdsourcing für Korrekturen in Transkribus. Automatischer Workflow für Export in eine statischen Seite.
Classical Text Editor
Verantwortlich: Stefan Hagel
Institut: ÖAI
Finanzierung: Selbstfinanzierung
Projektlaufzeit: Unbestimmt
Der Classical Text Editor ermöglicht die Erstellung kritischer Editionen sowohl in digitaler als auch in gedruckter Form; Er importiert Texte von Transkribus inklusive Links zu Image Regions.
DWA-Austria – Pilotstudie
Team: Alexandra N. Lenz, Markus Kunzmann
Institut: ACDH
Finanzierung: Pilotstudie der ÖAW, Vorbereitung auf FWF-Antrag
Projektlaufzeit: Okt. 2022 – Sept. 2023
Vollständige Digitalisierung österreichischer Fragebögen für den Deutschen Wortatlas (DWA).
Arthur Schnitzler – Briefwechsel mit Autorinnen und Autoren
Team: Martin Anton Müller (PI), Laura Untner
Institut: ACDH
Finanzierung: FWF
Projektlaufzeit: 2018–2024
Transkription der Korrespondenz. Training von freien Handschriftenmodellen.
Eduard Hanslicks Kritiken zwischen Ästhetik, Publizistik und Wissenschaft
Team: Alexander Wilfing (PI), Katharina Bamer, Daniel Elsner, Christoph Landerer, Anna-Maria Pfiel
Institut: ACDH
Finanzierung: FWF
Projektlaufzeit: Mai 2022–Okt. 2025
Im Hanslick-Online Projekt wird bzw. wurde Transkribus für die automatisierte Texterkennung verwendet. Die Daten wurden dann via API in ein TEI/XML Format überführt.
Familiensache. Dynastische Handlungsspielräume in der Korrespondenz von Kaiserin Eleonora Magdalena von Pfalz-Neuburg (1655-1720)
Team: Katrin Keller (PI), Peter Andorfer
Institute: IHB, ACDH
Finanzierung: FWF
Projektlaufzeit: 2021–2024
In diesem Projekt wurde Transkribus in erster Linie zur Erleichterung der Transkription verwendet. Der Datenimport und -export sowie die Datenkonvertierung zu TEI/XML wurden mit dem Python-Package acdh-transkribus-utils realisiert, das am ACDH-CH entwickelt wurde.
Listen in historischen Zeitungen: Herausforderungen und Potenziale der digitalen Analyse einer vernachlässtigten Textsorte
Team: Nina C. Rastinger
Institut: ACDH
Finanzierung: ÖAW DOC-Stipendium
Projektlaufzeit: 2023–2026
Das durch ein DOC-Stipendium der ÖAW geförderte Dissertationsprojekt setzt sich, gestützt von Methoden der digitalen Textwissenschaft und der Korpuslinguistik, mit periodisch publizierten Listen in gedruckten deutschsprachigen Zeitungen zwischen 1600 und 1850 auseinander. Über Transkribus werden dabei zum einen Volltextdigitalisate ausgewählter Listen erstellt und zum anderen Strategien erprobt, um die Textsorte in historischen Zeitungen, z.B. auf Basis ihres Layouts, systematisch zu identifizieren.
B-VG 1920 – Die Entstehung des Bundes‐Verfassungsgesetzes 1920
Team: Thomas Olechowski, Jörg Kammerhofer, Alexandra N. Lenz
Institutionen/Institute: Universität Wien, ACDH, Universität Freiburg
Finanzierung: FWF, DFG
Projektlaufzeit: Jan. 2023–Dez. 2025
Es existieren relativ viele Textzeugen – teils Entwürfe der Verfassung, teils „Paratexte“ wie Protokolle parlmentarischer Sitzungen etc. – die materiell ziemlich divers sind; z.B. Typoskripte, Manuskripte, Drucke und Lithografien. Die Scans werden aus Goobi auf Transkribus hochgeladen, um dort eine grundlegende Texterkennung und Korrekturen derselben durchzuführen. Für die Erfassung/Kodierung typografischer, spatialer und genetischer Informationen wird ausschließlich XML verwendet, nicht die von Transkribus angebotene Funktionen.
Oberkammeramtsrechnungen der Stadt Wien
Team: Robert Klugseder (PI), Daniel Schopper, Fernando Sanz-Lázaro, Johanna Maria Unterholzner and Peter Andorfer
Institutionen: ACDH, Wiener Stadt- und Landesarchiv (MA 8)
Finanzierung: BMKÖS (Kulturerbe Digital)
Projektlaufzeit: Nov. 2024–April 2026
Digitale Edition von 289 deutschsprachigen Rechnungsbüchern von 1424–1768. Automatische Texttranskription mit Layout- und Textmodelltraining. Die Rechnungsaufzeichnungen enthalten wichtige Informationen über die Geschichte Wiens.
Choralhandschriften der Zentralbibliothek der Wiener Franziskanerprovinz Graz
Team: Robert Klugseder (PI), Daniel Schopper
Institut: ACDH
Finanzierung: BMKOES
Projektlaufzeit: Juni 2023–August 2024
Ziel dieses Projekts ist die Digitalisierung von 53 spätmittelalterlichen und frühneuzeitlichen Choralhandschriften, Choralorgelbüchern und seltenen Choraldrucken der Zentralbibliothek der Franziskaner in Graz. Automatisierte Transkription der Texte, Training und Anwendung von Modellen für Layout- und Texterkennung.
Recognition of musical notation in medieval and early modern chant books
Team: Robert Klugseder (PI), Jorge Calvo-Zaragoza, Schorsch Hackl
Institut: ACDH
Finanzierung: ACDH, Universidad de Alicante, READ COOP SCE
Projektlaufzeit: Dez. 2023–Aug. 2024
Automatisierte Transkription von Texten und Musiknotation in liturgischen Gesangshandschriften. Entwicklung einer Erweiterung für Transkribus, die eine automatisierte Transkription von mittelalterlichem Cantus Planus ermöglicht.
TibSchol – The dawn of Tibetan Buddhist Scholasticism (11th-13th c.)
PI : Pascale Hugon
Institut : IKGA
Finanzierung : ERC
Projektlaufzeit: Bis Juni 2026
Ein Modell zur Layoutanalyse ("Tibetan Pecha") und zwei HRT-Modelle wurden auf der Transkribus-Plattform zur Transkription von Dokumenten in zwei Variationen von hangeschriebener tibetischer Schrift trainiert. Diese Modelle wurden in Transkribus veröffentlicht und die Bodenwirklichkeit auf GitHub zur Verfügung gestellt. Links zur Dokumentation, Datensets und Tools sind auf der Projektwebsite zu finden.
Wiens Merkwürdigkeiten – Deep Mapping frühneuzeitlicher Reisehandbücher
Team: Nina C. Rastinger (PI), Stefanie Salzburger
Institut: ACDH
Finanzierung: Stadt Wien
Projektlaufzeit: 2023–2024
In dem von der Stadt Wien finanzierten Projekt werden historische Wahrnehmungen Wiens untersucht, indem Reiseführer aus dem 18. und frühen 19. Jahrhundert mit digitaler Textanalyse und GIS-basierten Methoden kombiniert werden. Hierbei wird Transkribus dazu verwendet, verlässliche Volltexte zu erzeugen und (semi-)automatische strukturelle Annotationen vorzunehmen, letzteres insbesondere durch das Training werkspezifischer Layouterkennungsmodelle.
Vienna Syriac Gospels (Serto) HTR Public Model
Team: Ephrem Aboud Ishac (Project Lead), Christine Roughan (Project Lead), Syriac Group of the HTR Winter School 2024 - IMAFO Vienna (Contributors)
Institute: IMAFO - Austrian Academy of Sciences; MARBAS - Princeton University
Finanzierung: FWF (Teilfinanzierung)
Projektlaufzeit: Nov. 2024 - Jan. 2025
In diesem Projekt wurde das erste öffentliche syriakische HTR-Modell auf Transkribus trainiert. Das Modell wurde mithilfe syriakischer Manuskripte entwickelt, die 1554 von Moses von Mardin angefertigt wurden und die sich nun in der Österreichischen Nationalbibliothek in Wien befinden. Dieses Basismodell bietet einen Ausgangspunkt für die Transkription weiterer syriakischer Handschriften in Serto und kann zum Training weiterer projektspezifischer Modelle in Transkribus verwendet werden.
Vienna Syriac Gospels (Serto) HTR Public Model
Team: Ephrem Aboud Ishac (Project Lead), Christine Roughan (Project Lead), Syriac Group of the HTR Winter School 2024 - IMAFO Vienna (Contributors)
Institute: IMAFO - Austrian Academy of Sciences; MARBAS - Princeton University
Financing: FWF (partial funding)
Project Duration: Nov 2024 - Jan 2025
This project trained the first public Syriac HTR model on Transkribus. The model was developed using the Syriac Gospels manuscript (ÖNB Cod. Syr. 1), scribed by Moses of Mardin in 1554 and held at the Austrian National Library in Vienna. This base model provides a starting point for transcribing other Syriac manuscripts in Serto script, and users can further train their own models on Transkribus for specific projects.
Visiting Vienna – Digitale Ansätze zur (semi-)automatischen Auswertung der Ankunftslisten des „Wien[n]erischen Diariums“
Team: Nina C. Rastinger (PI), Thomas Kirchmair
Institut: ACDH
Finanzierung: Stadt Wien
Projektlaufzeit: 2022–2023
Im Rahmen des von der Stadt Wien geförderten Projekts wurde Transkribus eingesetzt, um verlässliche Volltexte der im Wien[n]erischen Diarium abgedruckten Ankunftslisten zu erstellen, welche dann wiederum über Named Entity Recognition-Verfahren semantisch angereichert und auf historischen Stadtplänen Wiens gemappt wurden.
Wien[n]erisches Diarium digital
Team: Claudia Resch (PI), Dario Kampkaspar, Nina C. Rastinger
Institut: ACDH
Finanzierung: ÖAW go!digital, Stadt Wien, ACDH
Projektlaufzeit: 2017 ff.
Bei der Volltexterschließung der historischen Wiener Zeitung wurde Transkribus erstmals auf einen großen Datensatz von Frakturdruck angewandt. Ein Ergebnis davon ist das öffentliche KI-Modell „Deutsche Fraktur 18. Jahrhundert“, das inzwischen in vielen Digitalisierungsvorhaben Anwendung findet.
