Sprach- und Textkorpora – Potenziale und Herausforderungen aus sprach-, literatur- und kulturwissenschaftlicher Perspektive

09.30-10.00

Begrüßung und Einführung
Sprach- und Textkorpora am ACDH-CH

Alexandra N. Lenz

10.00-10.20

Austrian Media Corpus (amc): "Alles was in der Zeitung steht"

Hannes Pirker

10.20-10.40

Analysen lexikalischer Variation im AMC

Amelie Dorn & Theresa Ziegler

10.40-11.00

Das SFB-Korpus "Deutsch in Österreich" - Analysen zur Diminutivvariation

Katharina Korecky-Kröll

11.00-11.30

Diskussionsrunde

 

11.30-11.50

Kaffeepause

 

11.50-12.10

Lexikographie und Korpuslinguistik – die WBÖ-Belegdatenbank als Quelle variationslinguistischer Forschung

Philipp Stöckle

12.10-12.30

SHAWI – Daten und Analysen zu arabischen Dialekten

Stephan ProcházkaKarlheinz Mörth

12.30-12.50

Diskussionsrunde

 

12.50-14.00

Mittagspause

 

14.00-14.20

Vom Datenschatz zum Datensatz: Listen im DI(GIT)ARIUM

Claudia Resch & Nina Rastinger

14.20-14.40

Korpuslinguistische Anwendungsszenarien zur Beschreibung von grammatischem Wandel im Deutschen

Martina Werner

14.40-15.00

Diskussionsrunde

 

15.00-15.20

Kaffeepause

 

15.20-15.40

Wieso es Arthur Schnitzler-Korpora und kein Korpus gibt – und warum wir nichts dagegen tun

Martin Anton Müller & Laura Untner

15.40-16.00

Diskussionsrunde

 

16.00-16.20

Zusammenfassung und Ausblick

 

 


Please send an e-mail to acdh-ch-office(at)oeaw.ac.at if you wish to attend.

Registration is possible until November 17th, 2022.

 

Abstracts

Austrian Media Corpus (amc): "Alles was in der Zeitung steht"

Hannes Pirker

Dank einer Kooperation zwischen der Austrian Presse Agentur (APA) und der ÖAW kann das ACDH-CH ein einzigartiges Textkorpus anbieten, das beinahe die gesamte österreichische Printmedienproduktion der letzten drei Jahrzehnte enthält. Beim Forschungstag werden die wichtigsten Fakten zur Nutzung dieses Austrian Media Corpus (amc) präsentiert: welche Informationen – also welche für Texte und welche Zusatzannotationen – sind im Korpus enthalten und wie können Sie sich Zugriff auf diese Informationen verschaffen  – was also sind die administrativen und technischen Gegebenheiten für die Korpusnutzung. 

Analysen lexikalischer Variation im Austrian Media Corpus (amc)

Amelie Dorn & Theresa Ziegler

Im Vortrag wird das Potential des Austrian Media Corpus (amc) für Analysen lexikalischer Variation, insbesondere sogenannter „Austriazismen“, demonstriert. Im Diskurs über Standardsprache in Österreich nehmen Austriazismen eine besondere Rolle ein. Ihre Konzeptualisierung ist in der Forschungsliteratur – wie auch in der laienlinguistischen Reflexion – heterogen: Den Definitionsversuchen gemein ist der österreichtypische Status, der Austriazismen zugeschrieben wird.  Ein häufig zitiertes Charakteristikum von Austriazismen stellt etwa die standardsprachliche Geltung einer Variante dar, wofür das Auftreten in Kodizes (mit Österreichbezug) als Kriterium herangezogen wird.  Über den Sprachgebrauch werden Austriazismen hinsichtlich ihrer Frequenz definiert; ob nur die landesweite Verwendung von Varianten, oder auch das exklusive Vorkommen in einzelnen österreichischen Teilregionen eine Variante zum Austriazismus qualifiziert, ist hingegen umstritten. Werden attitudinal-perzeptive Aspekte für die Definition ins Zentrum gerückt, gilt als Austriazismus, was als prototypisch, erwartbar bzw. angemessen für den österreichischen Sprachraum angesehen wird.

Austriazismen – insbesondere jenen auf lexikalischer Ebene, weniger prominent vertreten sind etwa phonetische und grammatische Varianten – wird eine identitätsstiftende Funktion zugeschrieben. In diesem Zusammenhang werden sie im Forschungs- sowie auch im Laiendiskurs häufig im Kontext von Bedrohungsszenarien verhandelt, sowohl was ihre areal-horizontale als auch vertikal-soziale Verwendung betrifft.

Unser Vortrag zeigt ausgewählte lexikalische Analysen aus einem Pool von über 100 multi-dimensional untersuchten Austriazismen, die sowohl areal-horizontale Variation als auch diachrone Dynamik fokussieren. Die präsentierten Fragestellungen und Ergebnisse stehen im größeren Kontext des Spezialforschungsbereichs „Deutsch in Österreich. Variation – Kontakt – Perzeption“ (FWF F60) (Lenz 2018), welcher sich unter anderem mit Fragestellungen zur deutschen Sprache in Österreich aus variationslinguistischer Perspektive beschäftigt.

Referenzen

  • Austrian Media Corpus (amc). Version 4.1, amc.acdh.oeaw.ac.at (Stand: 15.11.2022).
  • Lenz, Alexandra N. (2018): The Special Research Programme „German in Austria. Variation – Contact – Perception“. In: Ammon, Ulrich & Marcella Costa (Hgg.): Sprachwahl im Tourismus – mit Schwerpunkt Europa. (Sociolinguistica. Internationales Jahrbuch für europäische Soziolinguistik 32). Berlin/Boston, 269–277.

Das SFB-Korpus "Deutsch in Österreich" - Analysen zur Diminutivvariation

Katharina Korecky-Kröll

Das Korpus des Teilprojekts PP03 „Spracherepertoires und Varietätenspektren“ des SFB „Deutsch in Österreich. Variation - Kontakt - Perzeption“ beinhaltet Daten von Erwachsenen zweier Altersgruppen (18-35/60+) und zweier Bildungshintergründe (+/- Matura) aus ländlichen Regionen Österreichs. Die Daten wurden in unterschiedlichen freien und kontrollierten standardnahen und dialektnahen Settings erhoben und bilden eine geeignete Grundlage für Analysen zur vertikalen Variation auf allen sprachlichen Ebenen. Der Vortrag fokussiert das Phänomen der Diminutivbildung, das an der Schnittstelle zwischen Morphologie und Pragmatik liegt. Die Ergebnisse zeigen einerseits eine hohe morphologische Formenvielfalt und andererseits ein ambivalentes Verhältnis der Sprecher*innen zum pragmatisch aufgeladenen Phänomen der Diminutivbildung.

Lexikographie und Korpuslinguistik – die WBÖ-Belegdatenbank als Quelle variationslinguistischer Forschung

Philipp Stöckle

Der Beitrag widmet sich der Untersuchung grammatischer Variation auf der Grundlage einer umfassenden Materialsammlung, die ursprünglich (und nach wie vor primär) lexikographischen Zwecken dient, in der jüngeren Vergangenheit aber vermehrt für variationslinguistische Analysen herangezogen wurde: die Datenbank des "Wörterbuchs der bairischen Mundarten in Österreich" (WBÖ). Die Daten wurden größtenteils in der ersten Hälfte des 20. Jahrhunderts mit der Hilfe von freiwilligen Sammlerinnen und Sammlern auf der Grundlage von Fragebögen zusammengetragen und bilden – mit einem Umfang von ca. 3,6 Millionen Handzetteln – den sog. "Hauptkatalog". Dieser wurde seit den 1990er Jahren zu einem großen Teil digitalisiert und ist mittlerweile über das "Lexikalische Informationssystem Österreich" (LIÖ) (https://lioe.dioe.at/) öffentlich zugänglich.

Neben ihrer Grundlagenfunktion für die Wörterbucharbeit lassen sich die Daten in vielfacher Hinsicht (etwa lautlich, semantisch, morphologisch, syntaktisch) variationslinguistisch auswerten. Exemplarisch soll in dem Vortrag anhand des Phänomens der sog. "Negationskongruenz" (Des mecht neamd ned glaubm – 'Das möchte niemand nicht glauben') das Potenzial der WBÖ-Datenbank aufgezeigt werden, Forschungslücken bei der empirischen Erfassung und Analyse der historischen bairischen Basisdialekte Österreichs zu schließen und gleichzeitig eine Kontrastfolie für gegenwärtige Forschung zur Sprachvariation in Österreich zu liefern.

SHAWI – Daten und Analysen zu arabischen Dialekten

Stephan Procházka & Karlheinz Mörth

Das Projekt, das im Februar 2021 begonnen wurde und in Zusammenarbeit zwischen dem ACDH-CH und dem Institut für Orientalistik der Universität Wien durchgeführt wird, erforscht die gesprochenen arabischen Varietäten der Region Harran-Urfa im Südosten der Türkei, bei denen es sich durchwegs um gefährdete Minderheitenvarietäten handelt. Das Projekt ist Teil des VICAV-Projekt-Bündels und zielt auf drei Hauptbeiträge ab: ein digitales Textkorpus, eine umfassende Grammatik der Varietät und ein digitales Wörterbuch. Das Corpus entsteht auf der Basis transkribierter Tonaufnahmen, die in TEI aufbereitet werden und auch die Grundlage für das im Entstehen begriffene Wörterbuch darstellen. In unserer Präsentation stellen wir neue texttechnologische Entwicklungen sowie erste Ergebnisse der sprachwissenschaftlichen Analyse der umfangreichen Materialien vor.

Vom Datenschatz zum Datensatz: Listen im DI(GIT)ARIUM

Claudia Resch & Nina C. Rastinger

Der Vortrag widmet sich dem DIGITARIUM (Resch & Kampkaspar 2020, https://digitarium.acdh.oeaw.ac.at), das User*innen einen Datenschatz von über 300 hochqualitativen Volltextausgaben des Wien[n]erischen Diariums aus dem 18. Jahrhundert zur Verfügung stellt. Nach Vorbemerkungen zur Genese des historischen Spezialkorpus werden dessen Potenziale exemplarisch anhand zweier Forschungsprojekte diskutiert, im Rahmen derer jeweils die bislang vernachlässigte Zeitungstextsorte der Listen in den Fokus rückt:
Im Projekt “Vienna Time Machine” (PI: Claudia Resch) ist erprobt worden, wie sich aus den semistrukturierten Listen der Verstorbenen personenbezogene Datensätze gewinnen lassen, während im Projekt “Visiting Vienna” (PI: Nina C. Rastinger) Ankunftslisten transkribiert, semantisch angereichert und auf historischen Stadtplänen Wiens visualisiert werden.

Korpuslinguistische Anwendungsszenarien zur Beschreibung von grammatischem Wandel im Deutschen

Martina Werner

Der Vortrag skizziert anhand verschiedener Anwendungsbeispiele aus linguistischen Forschungsprojekten zur synchronen und diachronen Sprachwissenschaft das methodische Potenzial der Korpuslinguistik und der Digital Humanities für die Beschreibung von grammatischem Wandel im Deutschen. Die jeweiligen Regeln der Grammatik des Deutschen und ihrer Variation ergeben sich dabei aus dem Sprachgebrauch. Daher ist die Erhebung und digitale Erschließung von Sprachdaten unabdingbar für die Ermittlung von grammatischen Regeln,  für die Beschreibung von sprachlichem Wandel in der Sprachgeschichte des Deutschen und für weitere, auch sprachübergreifende Generalisierungen.

Wieso es Arthur Schnitzler-Korpora und kein Korpus gibt – und warum wir nichts dagegen tun

Martin Anton Müller & Laura Untner

In unserem Vortrag geht es um sieben existierende und drei geplante
Websites, die Lebensdokumente von Arthur Schnitzer erschließen. Am
Anfang steht eine Vorstellung der einzelnen Sammlungen und Überlegungen
über die Schere zwischen dem, was möglich ist, und dem Wünschenswerten.
Den Schluss der Präsentation bilden Überlegungen, wo das hinführen kann.


Date

1st December 2022


Place

Austrian Academy of Sciences
Sonnenfelsgasse 19
Theatersaal
1010 Vienna


Register via e-mail

Registration is possible until November 17th, 2022.