Kontakt PhA: Christian Huber
Kontakt Abt. „Sprachwissenschaft“ ÖAW und SFB DiÖ: (seit 2022) Philipp Stöckle (bis 2021: Ludwig Maximilian Breuer)

Lebendige Sprachen und ihre Varietäten sind hochdynamische Systeme, die einem ständigen Wandel unterliegen. Einen authentischen Zugang zu früheren Stufen gesprochensprachlicher Varietäten liefern idealerweise Tonaufnahmen, die zumindest für die letzten ca. 130 Jahre in eingeschränktem Maße vorhanden sind und Schnappschüsse älterer Sprachzustände festhalten. Solche Aufnahmen gilt es zu erhalten und nutzbar zu machen.

Das Projekt zur Aufbereitung und Erschließung des Korpus Österreichische Dialektaufnahmen aus dem 20. Jahrhundert wird in enger Zusammenarbeit zwischen dem Phonogrammarchiv (PhA), der Forschungsabteilung Sprachwissenschaft des ACDH-CH (vormals Variation und Wandel des Deutschen in Österreich, VaWaDiÖ) und dem Spezialforschungsbereich Deutsch in Österreich. Variation – Kontakt – Perzeption  (SFB DiÖ) durchgeführt. Im Fokus stehen die Digitalisierung, Metadaten-Anreicherung und -systematisierung sowie die korpuslinguistische Aufbereitung einer Sammlung von Dialektaufnahmen aus den Jahren 1951–1995, um sie nachhaltig zu bewahren und sie der Wissenschaft wie auch einem breiteren Publikum nutzbar und zugänglich zu machen.

Durch das Kooperationsprojekt wird ein digitales, durchsuchbares Korpus in Form einer interdisziplinären Online-Plattform geschaffen. Dies soll eine optimale Auswertbarkeit dieses linguistisch wie soziokulturell und soziohistorisch einmaligen Bestandes für verschiedenste Forschungszwecke gewährleisten. Durch die Digitalisierung der Aufnahmen sowie die Anreicherung, Systematisierung und Durchsuchbarmachung der Metadaten in der elektronischen Dokumentation und die korpuslinguistische Annotation wird es möglich, die Aufnahmen in unterschiedlichsten wissenschaftlichen Kontexten zu nutzen.

Die Dialektaufnahmen des PhA aus der ersten Hälfte des 20. Jahrhunderts werden in der Edition Gesamtausgabe der Historischen Bestände 1899–1950 veröffentlicht.

Das Korpus

In der ersten Hälfte des 20. Jahrhunderts waren seit den frühen 1900er Jahren die Feldaufnahmen des Phonogrammarchivs mit Hilfe des Archiv-Phonographen erstellt worden. Mit Einzug der Magnetbandaufnahmetechnik am Phonogrammarchiv im Jahre 1951 standen der tonaufnahmegestützten Feldforschung jedoch völlig neue Möglichkeiten zur Verfügung. Seitdem haben eine Reihe Sprachwissenschaftler- und auch Volkskundler*innen in ganz Österreich (sowie angrenzenden deutschsprachigen Gebieten in Italien, Slowenien, Ungarn, Tschechien und Rumänien) Dialektaufnahmen auf Tonband festgehalten. Diese für die österreichische Dialektlandschaft einmaligen Aufnahmen wurden in Kooperation mit dem Phonogrammarchiv der ÖAW durchgeführt, wo die Bänder mit den Aufnahmen archiviert sind. Sie stellen eine einzigartige historische Quelle für das Studium der österreichischen Dialektlandschaft nach der Mitte des 20. Jahrhunderts dar.

Beim Korpus Österreichische Dialektaufnahmen aus dem 20. Jahrhundert handelt es sich um eine Auswahl von etwa 2450 Aufnahmen (bzw. rund 540 Stunden Audiomaterial), die in den Jahren 2016–2018 aus den Aufnahmebeständen auf Magnetband zusammengestellt und 2018 finalisiert wurde. Das Korpus umfasst somit ungefähr die Hälfte der deutschsprachigen Dialektaufnahmen des Phonogrammarchivs.

Einen gewichtigen Teil im Korpus macht das Subkorpus Tonaufnahmen österreichischer Dialekte 1951–1983 aus, das im Herbst 2018 auch in das Memory of Austria-Verzeichnis der UNESCO aufgenommen wurde. Diese Sammlung von ca. 1750 Tonaufnahmen auf Magnetband (etwa 263 Std.) entstand im Rahmen einer Kooperation des Phonogrammarchivs der ÖA und der sogenannten „Wörterbuchkanzlei“ der ÖAW (i.e. „Kommission zur Schaffung des Österreichisch-Bayerischen Wörterbuches“, ab 1969 „Kommission für Mundartkunde und Namenforschung“). In den 1950ern und 1960ern erfolgte unter der Leitung von Maria Hornung und Eberhard Kranzmayer eine großangelegte österreichweite (und gelegentlich landesübergreifende) Aufnahmeunternehmung zur phonographischen Dokumentation von Basisdialekten durch spontansprachliche Aufnahmen in hunderten Orten. Beteiligt waren hier u.a. auch Eugen Gabriel, Werner Bauer, Herbert Tatzreiter, und Franz Roitinger. Die Aufnahmetätigkeit beschränkte sich nicht nur auf deutschsprachige Varietäten, sondern erfasste auch die österreichischen Minderheitensprachen Kroatisch, Romanes und Ungarisch im Burgenland, Slowenisch in Kärnten, sowie Ladinisch und lokale Italienischvarietäten in Norditalien. Weitere Aufnahmen aus dieser Zeit entstanden in universitären Kontexten etwa durch Hans Pusch, Alois Brandstetter, Oskar Pausch und Helga Ebner-Hiermanseder, durch Walter Graf vom Phonogrammarchiv, die Volkskundler*innen Károly Gaál, Leopold Kretzenbacher, Hans Haid, Hans Hönig­schmied & Josef Kirchner, Elfriede Lies und Franz Lipp, sowie durch den 1938 nach Australien geflohenen Erwin Koch-Emmery.

Die 1970er und 1980er Jahre kennzeichnen sich im Korpus vor allem durch die Feldforschungstätigkeit von Werner Bauer, Herbert Tatzreiter, Wilfried Schabus, Franz Patocka, Hermann Scheuringer, Friedrich Bouterwek, Ingeborg Schönhuber (Geyer), Heinz-Karl Stark, Ingrid Bigler-Marschall, Barbara Jocher, Roland Girtler und Günter Lipold, die Feldforschung in allen österreichischen Bundesländern außer Vorarlberg durchführten. Das Korpus enthält damit auch Vergleichsmaterialien im zeitlichen Abstand von ca. 20 Jahren. Maria Hornung ist in diesem Zeitraum im Korpus durch Aufnahmen aus Norditalien, Slowenien, Burgenland und Oberösterreich/Bayern vetreten. Um die nur geringe Zahl von Wiener Aufnahmen im Korpus zu erhöhen, wurden auch Wilfried Schabusens Interviews mit älteren Wiener*inne*n (1992–1995) ins Korpus aufgenommen.

 

Die Aufbereitung des Korpus

Die Aufbereitung des Korpus ist in der Hauptsache mit der Digitalisierung analoger Materialien, der Anreicherung, Granularisierung und allfälligen Korrektur von Metadaten sowie der Transkription und korpuslinguistischen Annotation der Aufnahmen befasst. Durch die Digitalisierung der Aufnahmen, die Anreicherung, Systematisierung und Durchsuchbarmachung der Metadaten in der elektronischen Dokumentation wird es möglich, die Aufnahmen in einer Vielzahl von wissenschaftlichen Kontexten zu nutzen.

Digitalisierung

Traditionelle Tonträger wie Wachswalzen oder Tonbänder unterliegen einem natürlichen Verfall: Ist ein Tonträger nicht mehr abspielbar, sind die Aufnahmen für immer verloren. Außerdem sind für solche Datenträger spezielle Abspielgeräte nötig, die nur mehr in spezialisierten Einrichtungen funktionsfähig zur Verfügung stehen. Es ist daher unabdingbar, diese vergänglichen Tondokumente zu digitalisieren, um die Sprachdaten und Aufnahmeinhalte langfristig zu erhalten und verfügbar machen zu können.

Von den rund 2450 Aufnahmen im Korpus lag nur etwa ein Drittel bereits digitalisiert vor, so dass mehrere hundert Bänder digitalisiert und segmentiert werden mussten. Darüber hinaus waren viele bereits vorliegende Banddigitalisate nicht segmentiert worden, was ebenfalls in den Workflow aufgenommen wurde, neben der Erstellung einer technischen Digitalisierungsdokumentation. Die betreffenden Arbeiten sind mittlerweile abgeschlossen.

Metadaten

Für die optimale Durchsuchbarkeit des Korpus ist eine informationstechnologisch sorgfältig konzipierte und gut strukturierte Metadatenbeschreibung der Daten vonnöten. Bedingt durch personaltechnische Faktoren waren viele Datensätze in der PhA-Datenbank nur rudimentär angelegt, und etwa die Hälfte der Aufnahmen war nicht separat dokumentiert, sondern lediglich in Metadatenbündeln erfasst, in denen die Metadaten mehrerer Aufnahmen zusammengelegt waren, sodass Metadaten in einem Bündeleintrag nicht mehr den betreffenden einzelnen Aufnahmen zuordenbar waren. Zu ergänzende Metadaten aus den hand- oder maschinschriftlichen Originalprotokollen mussten manuell nachgetragen werden, zur Granularisierung von Bündeleinträgen wurde ein Matrixtool entwickelt.

Da die Zeitleisten in den Originalprotokollen der Aufnahmen, die angeben, wann in einer Aufnahme was passiert, oft nicht mit dem Anfang der jeweiligen Aufnahme beginnen, sondern mit dem Anfang des Tonbandes, die diese Aufnahme enthält (in der Regel neben mehreren andere Aufnahmen), mussten die Zeitmarken in etwa 900 Protokollen korrigiert und mit den Aufnahmen abgeglichen werden, um aufnahmelaufzeitalignierte Inhaltsprotokolle zu erhalten.

Aufgrund der großen Masse an nachzutragenden Daten und noch zu ermittelnden technischen Metadaten wurden verschiedene Strategien zur Vereinfachung der jeweiligen Arbeitsschritte entwickelt, etwa eine Stapelbearbeitung zur Ermittlung und tabellarischen Darstellung audiotechnischer Metadaten und Import großer Datenmengen in die Datenbank aus Tabellen.

Der areallinguistische Aspekt des Korpus erforderte eine systematische georeferenzierte Repräsentation der Dialektpunkte und anderer Örtlichkeiten. Dank eines von Statistik Austria zur Verfügung gestellten Datensatzes mit den Geodaten und offiziellen Bezeichnungen von nahezu 17300 Orten in Österreich konnte eine der Verwaltungsstruktur entsprechende hierarchische Gliederung der Toponyme in der elektronischen Dokumentation implementiert werden, die auch als Basis einer kartographischen Darstellung dienen kann. Die extrahierarchische Zuordnung von Orten zu Kulturregionen oder Dialektgebieten konnte aus budgetären Gründen bislang nicht umgesetzt werden.

Da einige der erforderlichen Prozeduren in der ursprünglichen PhA-Datenbank nicht realisierbar waren, wurde ein Exzerpt aus der PhA-Datenbank erstellt, das nur die Aufnahmen des Korpus enthält und entsprechend modifiziert wurde. Dabei wurde jedoch darauf geachtet, die strukturelle Integrität wo möglich zu erhalten, um eine geplante spätere Rückführung der Daten in die PhA-Datenbank zu vereinfachen.

Transkripte, Annotation

Im verfügbaren Dokumentationsmaterial liegen Transkripte zu Aufnahmen nur in sehr geringem Ausmaß vor. Da die fachgerechte Erstellung von Transkripten ein zeitaufwendiges Unterfangen ist, ist das Phonogrammarchiv 2021 dazu übergegangen, von Benützer*inne*n, die Aufnahmen aus dem Korpus für ihre Forschungen verwenden, allfällig entstandene Transkripte einzusammeln. Am ACDH-CH ist geplant, weitere Transkripte aus mit Aufnahmen aus dem Korpus befassten Drittmittelprojekten zu gewinnen. Im Nachlass von Maria Hornung vorgefundene Transkripte aus der Mitte der 1970er Jahre von verschiedenen Transkriptor*inn*en wurden mittels der Transkribus-Software maschinenlesbar gemacht. Die Transkripte werden mit den Korpuswerkzeugen von DiÖ annotiert werden.

 

Die nächsten Schritte

Da in Form der Projektdatenbank am Phonogrammarchiv nun eine granularisierte und angereicherte systematische elektronische Dokumentation vorliegt, soll jetzt die gemeinsame Plattform, in der die Metadaten-Strukturen des Phonogrammarchivs mit den korpuslinguistischen Strukturen des FSB DiÖ vereint werden, in Agriff genommen werden. Die Arbeit zur Errichtung der gemeinsamen Plattform hatte sich aufgrund personeller Engpässe am ACDH-CH bislang verzögert.

Der Online-Katalog zu den Korpusaufnahmen ist nach einer Verzögerung nun in Vorbereitung und soll noch 2023 verfügbar werden.

 

Team


Publikationen

Huber, Christian. 2023. “Why it Can be Difficult to Make Historic Language Recordings Accessible: A View from a Corpus of Historic Dialect Recordings.” Proceedings of the 2nd International Workshop on Digital Language Archives (LangArc-2023), ACM/IEEE Joint Conference on Digital Libraries, ed. by Oksana L. Zavalina & Shobhana L. Chelliah. Denton, Texas: University of North Texas.

Huber, Christian & Benjamin Fischer. 2021. “Digitising a corpus of Austrian dialect recordings from the 20th century”. Digital Lexis and Beyond, ed. by Christina Katsikadeli, Manfred Sellner & Michael Gassner, 38–65. Vienna: Austrian Academy of Sciences.

Lenz, Alexandra N., Ludwig Maximilian Breuer, Christian Huber, Benjamin Fischer & Bernhard Graf. 2020. “Österreichische Dialektaufnahmen im 20. Jahrhundert. Zur Genese, Aufbereitung und wissenschaftlichen Nutzung eines einmaligen Sprachkorpus”. International Forum on Audio-Visual Research – Jahrbuch des Phonogrammarchivs 10, 128–140.

Huber, Christian, Benjamin Fischer & Bernhard Graf. 2019. “Corpus of Austrian Dialect Recordings from the 20th Century – A Cooperation Project”. HSCR 2019. Proceedings of the Third International Workshop on the History of Speech Communication Research Vienna, September 13-14, 2019 (= Studientexte zur Sprachkommunikation 94), ed. by Michael Pucher, Jürgen Trouvain & Carina Lozo, 31–40. Dresden: TUDpress.

siehe auch Vorträge
 

Links:

„Tonaufnahmen österreichischer Dialekte 1951–1983“ in das nationale „Memory Of The World“-Register der UNESCO aufgenommen

Memory of Austria-Verzeichnis, Tonaufnahmen österreichischer Dialekte 1951-1983

ORF Science: Geistberger / Wieselberg: Dialektarchiv ist UNESCO-Welterbe

ÖAW: Dialektaufnahmen der ÖAW im „Gedächtnis der Menschheit“

Hörbeispiele

 

Projektgeschichte und -vorgeschichte

2012                     
Beginn der Aktivitäten am PhA zur Aufbereitung von Dialektaufnahmen auf Magnetband durch Christian Huber.

2014–2015
Christian Huber Mitglied im SAPID/LISTEN-Projektteam zur Einrichtung eines internationalen Repositoriums für Dialektaufnahmen europäischer Sprachen.
Erstellung eines Korpus von bereits digitalisierten Aufnahmen, Entwicklung von Strategien zur Metadatengranularisierung und -anreicherung, Entwicklung von Strategien zum ethischen und rechtlichen Umgang mit den Aufnahmen (vor allem Rechteabklärung hinsichtlich Online-Stellung, potentielle Registrierung von Aufnahmen als verwaiste Werke usw.; zusammen mit Jurist*inn*en der ÖAW).

2016 (März)
Beginn der Zusammenarbeit mit dem SFB Deutsch in Österreich(DiÖ) und der damaligen Forschungsabteilung Variation und Wandel des Deutschen in Österreich, VaWaDiÖ (Alexandra N. Lenz, Ludwig Maximilian Breuer) zur gemeinsamen Aufbereitung eines Korpus von historischen Dialektaufnahmen.
Erstellung verschiedener Aufnahmekorpusversionen, erste Digitalisierungsarbeiten.

2018 (Sept.)
Aufnahme einer Sammlung von Dialektaufnahmen auf Magnetband aus den Jahren 1951–1983 in das Memory of Austria-Verzeichnis der UNESCO.
Finalisierung der Aufnahmeauswahl für das aufzubereitende Korpus.

2018 (Nov.)
Erste Kooperationsvereinbarung mit SFB DiÖ und VaWaDiÖ.
Verstärkte Digitalisierungsaktivitäten, Vorbereitung der Metadatenanreicherung und -granularisierung.

2019 (Jan.)
Beginn der Arbeiten an der Korpusaufbereitung am Phonogrammarchiv.

 

Weitere Literatur (Auswahl)


Literatur zu den Dialektaufnahmen (und allgemein Sprachaufnahmen) im Phonogrammarchiv

Seemüller, Joseph, 1908. Deutsche Mundarten. I. Mitteilungen der Phonogrammarchivs-Kommission 11.

Pollak, Hans Wolfgang. 1913. Die Aufnahme deutscher Mundarten durch das Phonogramm-Archiv der kaiserlichen Akademie der Wissenschaften in Wien. Zeitschrift für Deutsche Mundarten 8, 83–88.

Seemüller, Joseph, 1909. Deutsche Mundarten. 2​​​​​​​. Mitteilungen der Phonogrammarchivs-Kommission 15.

Seemüller, Joseph, 1911. Deutsche Mundarten. 3. Mitteilungen der Phonogrammarchivs-Kommission 20.

Pfalz, Anton, 1913. Deutsche Mundarten. 4. Mitteilungen der Phonogramm-Archivs-Kommission 27.

Seemüller, Joseph, 1918. Deutsche Mundarten. 5. Mitteilungen der Phonogrammarchivs-Kommission 48.

Hajek, Leo. 1928. Das Phonogrammarchiv der Akademie der Wissenschaften in Wien von seiner Gründung bis zur Neueinrichtung im Jahre 1927. Mitteilungen der Phonogrammarchivs-Kommission 58.

Hornung, Maria. 1961. Tonaufnahmen im Dienste der Mundartforschung. Zeitschrift für Mundartforschung 28(2), 183–191.

Graf, Walter. 1964. Aus der Geschichte des Phonogrammarchivs der Österreichischen Akademie der Wissenschaften. Bulletin phonographique 6, 9–39.

Schabus, Wilfried. 1999. Die Bestände des Phonogrammarchivs an Sprachaufnahmen. Das audiovisuelle Archiv 45, 23–32.

Schabus, Wilfried. 2003. „Dazähl’n“ – 100 Jahre Dialektaufnahme in Österreich. Zusammengestellt und bearbeitet von Wilfried Schabus, unter Mitarbeit von Werner Bauer et al. OEAW PHA CD 20, 2003.

 

Phonogrammarchiv, ÖAW und Germanistik in der 1. Hälfte des 20. Jhs.

Wahlmüller, Marlene. 2010. Die Akademie der Wissenschaften in Wien. Kontinuitäten und Diskontinuitäten 1938-1945. Diplomarbeit, Universität Wien.

Braun, Jan David. 2015. Das ‚Lautdenkmal reichsdeutscher Mundarten zur Zeit Adolf Hitlers‘ in der ‚Ostmark‘.  Geisteswissenschaftliche Gemeinschaftsforschung am Beispiel der Germanistik von 1938 bis 1945. Masterarbeit, Universität Wien.

Kowar, Helmut. 2017. „Die Anlage einer Art phonographischen Archives“ – mehr als ein Archiv. Ein Überblick über die Geschichte des Phonogrammarchivs der Österreichischen Akademie der Wissenschaften. Geistes-, sozial- und kulturwissenschaftlicher Anzeiger 152(1), 5–45.

Feichtinger, Johannes, Katja Geiger & Stefan Sienell. 2022. Die Akademie der Wissenschaften in Wien im Nationalsozialismus und im Kontext der Akademien im „Altreich“. In: Johannes Feichtinger & Brigitte Mazohl (eds.), Die Österreichische Akademie der Wissenschaften 1847–2022. Eine neue Akademiegeschichte, Band 2, 11–141. Wien: Verlag der Österreichischen Akademie der Wissenschaften.

 

Dialektaufnahmen und das Selbstbild des Phonogrammarchivs im Nationalsozialismus

Ruth, Walter. 1940. Das Phonogrammarchiv der Akademie der Wissenschaften in Wien und seine Aufgaben. Mitteilungen der Phonogrammarchivs-Kommission 72.

Ruth, Walter. 1940. Bericht über die Südtiroler Mundartaufnahmen im Sommer 1940. Mitteilungen der Phonogrammarchivs-Kommission 73.