Transkribus
Transkribus is a platform for automated transcription of historical manuscripts and prints. Developed at the University of Innsbruck, it offers an array of tools and support provided by its community, which is currently made up by over 100 000 users, continually releasing new models and making them available for subsequent use.
Transkribus at the OeAW
Transkribus is already successfully being used at several institutes of the Austrian Academy of Sciences for text- and layout recognition. Researchers from numerous disciplines working in different project contexts are using various components of Transkribus' tool suite. The ACDH-CH connects Transkribus users at the OeAW: Basis for this network is the knowledge transfer between OeAW institutes, an exchange about the most recent developments of the platform as well as interdisciplinary reflection of the use of AI in the field of Digital Humanities.
Transkribus Coordinators at the OeAW
Austrian Centre for Digital Humanities and Cultural Heritage
Department of Musicology
Austrian Centre for Digital Humanities and Cultural Heritage
Department of Literary&Textual Studies
News
Transkribus Workshops at the OeAW
Upcoming:
- ACDH-CH Tool Gallery (beginners) - planned in April, more information coming soon
Archive:
Transkribus Events at the OeAW
Transkribus Projects at the OeAW
Arthur Schnitzler - Critical Edition (Early Works) IV
PI: Konstanze Fliedl
Institute: ACDH-CH
Financing: FWF
Project duration:
Für die historisch-kritische Ausgabe werden primär relevante Drucktexte (Erstdrucke und Erstausgaben), sowie Materialien aus dem Nachlass eingelesen. Während Drucke und Typoskripte OCR gelesen und anschließend kollationiert werden, werden Handschriften in Transkribus manuell transkribiert. Anschließend werden die Texte als xml exportiert.
Arthur Schnitzler: Collection of newspaper clippings
Team: Peter Andorfer, Martin Anton Müller, Ingo Börner
Institute: ACDH-CH
Financing: various
Project duration:
Automatische Erkennung von Mikrofiche-Scans. Die Website spiegelt derzeit über die API den Transkribus-Server einschließlich der Bilder.
Edition of Arthur Schnitzler's literary correspondences
Team: Martin Anton Müller (PI), Laura Untner
Institute: ACDH-CH
Financing: FWF
Project duration:
Transkription der Korrespondenzstücke. Training von freien Handschriftenmodellen.
Clara Katharina Pollaczek: Arthur Schnitzler and me
Team: Martin Anton Müller (PI), Laura Untner
Institute: ACDH-CH
Financing: FWF
Project duration:
Automatische Erkennung des Typoskripts. Crowd Sourcing für Korrekturen in Transkribus. Automatischer Workflow für Export in eine Static-Seite.
Auden in Austria Digital (AAD)
Team: Sandra Mayer (PI), Timo Frühwirth
Institute: ACDH-CH
Financing: FWF
Project duration:
Trainieren eines (in der Folge öffentlich zu machenden) Modells für die 'späte' Handschrift von W. H. Auden (das heißt, im Zeitraum 1958-1973) sowie Anwendung öffentlicher Modelle für englische und deutschsprachige Schreibmaschinen- und Druckschrift.
Eduard Hanslick’s Criticism between Aesthetics, Journalism, and Scholarship
Team: Alexander Wilfing (PI), Katharina Bamer, Daniel Elsner, Christoph Landerer, Anna-Maria Pfiel
Institute: ACDH-CH
Financing: FWF
Project duration:
Im Hanslick Online Projekt wird/wurde Transkribus für die automatisierte Texterkennung verwendet und die Daten werden via API in ein TEI/XML Format überführt.
Family Matters. Female Dynastic Agency and Correspondence
Team: Katrin Keller (PI), Peter Andorfer
Institutes: IHB, ACDH-CH
Financing: FWF
Project duration:
Transkribus wurde dabei in erster Linie für die Erleichterung der Transkription verwendet. Für den Datenimport und -export, sowie die Datenkonvertierung nach TEI/XML haben wir mittels am ACDH-CH entwickelten Python Package acdh-transkribus-utils realisiert.
Listen in historischen Zeitungen: Herausforderungen und Potenziale der digitalen Analyse einer vernachlässtigten Textsorte
Team: Nina C. Rastinger
Institute: ACDH-CH
Financing:
Project duration:
Das durch ein DOC-Stipendium der ÖAW geförderte Dissertationsprojekt setzt sich, gestützt von Methoden der digitalen Textwissenschaft und der Korpuslinguistik, mit periodisch publizierten Listen in gedruckten deutschsprachigen Zeitungen zwischen 1600 und 1850 auseinander. Über Transkribus werden dabei zum einen Volltextdigitalisate ausgewählter Listen erstellt und zum anderen Strategien erprobt, um die Textsorte in historischen Zeitungen, z.B. auf Basis ihres Layouts, systematisch zu identifizieren.
Making the Austrian Federal Constitution 1920
Team: Thomas Olechowski, Jörg Kammerhofer, Alexandra N. Lenz
Institution/Institute: Universität Wien, ACDH-CH, Universität Freiburg
Financing: FWF, DFG
Project duration:
Es existieren relativ viele Textzeugen – teils Entwürfe der Verfassung, teils "Paratexte" wie Protokolle parlmentarischer Sitzungen etc. – die materiell ziemlich divers sind; z.B. Typoskripte, Manuskripte, Drucke und Lithografien. Die Scans werden aus Goobi nach Transkribus hochgeladen, um dort eine basale Texterkennung und Kontrolle derselben durchzuführen. Für die Erfassung/Kodierung typografischer, spatialer und genetischer Informationen wird ausschließlich XML und nicht die von Transkribus angebotene Funktionalität verwendet.
Plainchant manuscripts of the Central Library of the Viennese Franciscan Province Graz
Team: Robert Klugseder (PI), Daniel Schopper
Institute: ACDH-CH
Financing: BMKOES
Project duration:
The aim of this project is the digitisation of 53 late medieval and early modern chant manuscripts, chant organ books and rare chant prints from the Central Library of the Franciscans in Graz. Automated transcription of the lyrics, training and application of models for layout and text writing.
Recognition of musical notation in medieval and early modern chant books
Team: Robert Klugseder (PI), Jorge Calvo-Zaragoza, Schorsch Hackl
Institute: ACDH-CH
Financing: ACDH-CH, Universidad de Alicante, READ COOP SCE
Project duration:
Automated transcription of song text and music notation in liturgical chant manuscripts. Development of an extension for Transkribus, which will make it possible to automatically transcribe medieval plainchant.
Vienna's memorable sites – Deep mapping early modern travel guides
Team: Nina C. Rastinger (PI), Stefanie Salzburger
Institute: ACDH-CH
Financing: Stast Wien
Project duration:
In dem von der Stadt Wien finanzierten Projekt werden historische Wahrnehmungen Wiens untersucht, indem Reiseführer aus dem 18. und frühen 19. Jahrhundert mit digitaler Textanalyse und GIS-basierten Methoden kombiniert werden. Hierbei wird Transkribus dazu verwendet, verlässliche Volltexte zu erzeugen und (semi-)automatische strukturelle Annotationen vorzunehmen, letzteres insbesondere durch das Training werkspezifischer Layouterkennungsmodelle.
Visiting Vienna – Digital approaches to the (semi-) automatic analysis of the arrival lists found in the "Wien[n]erisches Diarium"
Team: Nina C. Rastinger (PI), Thomas Kirchmair
Institute: ACDH-CH
Financing:
Project duration:
Im Rahmen des von der Stadt Wien geförderten Projekts wurde Transkribus eingesetzt, um verlässliche Volltexte der im Wien[n]erischen Diarium abgedruckten Ankunftslisten zu erstellen, welche dann wiederum über Named Entity Recognition-Verfahren semantisch angereichert und auf historischen Stadtplänen Wiens gemappt wurden.
Wien[n]erische Diarium digital
Team: Claudia Resch (PI), Dario Kampkaspar, Nina C. Rastinger
Insitute: ACDH-CH
Financing: ÖAW go!digital, Stadt Wien, ACDH-CH
Project duration:
Bei der Volltexterschließung der historischen Wiener Zeitung wurde Transkribus erstmals auf einen großen Datensatz von Frakturdruck angewandt. Ein Ergebnis davon ist das öffentliche KI-Modell "Deutsche Fraktur 18. Jahrhundert", das inzwischen in vielen Digitalisierungsvorhaben Anwendung findet.
Transkribus for students
In the winter semester 2024/25, the following course will be offered at the University of Vienna:
136208 UE Transkribus in den Digital Humanities: KI-gestützte Layout- und Texterkennung