Sprachkorpora und Open Access: Nutzbarkeit und Technologie von VOICE 3.0 Online

Open Access (OA) ist der Goldstandard für jedes Sprachkorpus. Doch nach Abschluss eines Projekts ist es oft eine Herausforderung, Open-Access-Webanwendungen langfristig am Leben zu erhalten, obwohl die Zusammenstellung von (gesprochenen) Korpora zeit- und kostenintensiv ist. Die Tool-Galerie 8.1. beschäftigt sich mit dieser Herausforderung, indem sie Einblicke in die Entwicklung und Benutzerfreundlichkeit der neuen Webanwendung für das Vienna-Oxford International Corpus of English (VOICE, erstmals veröffentlicht 2009) gibt, die im Rahmen des VOICE CLARIAH-Projekts (2020-2021) entwickelt wurde.

Der erste Tag der Tool Gallery richtet sich an Forscher*innen, Doktorand*innen und fortgeschrittene Studierende, die daran interessiert sind, mit transkribierten gesprochenen Daten zu arbeiten und diese zu analysieren. Zuerst werden wir VOICE vorstellen, ein Korpus von einer Million Wörtern gesprochenem Englisch als Lingua Franca (ELF)-Interaktionen. Danach befassen wir uns mit seiner Benutzerfreundlichkeit als OA-Tool für die linguistische Forschung. Wir werden über spezifische Eigenschaften gesprochener Korpora (wie Feldarbeit, Datenerfassung, detaillierte Transkription, Konversationsmarkup und Metadaten) diskutieren und durch zahlreiche praktische Übungen eine detaillierte Einführung in das neue VOICE 3.0 Online OA-Webinterface und seine Funktionalitäten bieten.

Der zweite Tag der ACDH-CH Tool Gallery wirft einen Blick hinter die Kulissen und konzentriert sich ganz auf die Open-Access-Technologien, die für die Erstellung des neuen VOICE 3.0 Online Webinterface verwendet und entwickelt wurden. Wir stellen die wichtigsten Eigenschaften von VOICE 3.0 XML vor, widmen uns dem Prozess der Einrichtung einer lokalen NoSketch Engine-Instanz zum Ausführen von Suchabfragen und bieten Einblick in die Technologie-Stacks und OA-Softwarepakete. Der zweite Tag richtet sich primär an Forscher*innen, Doktorand*innen, fortgeschrittene Studierende und Programmierer*innen mit Interesse an der Erstellung von Open-Access-Webanwendungen für Sprachkorpora und verwandte Ressourcen. Etwas technologisches Know-how in der Korpuslinguistik, im Webdesign, in XML-Technologien oder in der Softwareentwicklung ist von Vorteil, aber keine Voraussetzung.

Die ACDH-CH Tool Gallery endet mit einem Abschlusspanel an Tag 2, in dem Mitglieder des VOICE CLARIAH-Projekts zur Verfügung stehen, um Fragen zum Projektmanagement und -umsetzung, der interdisziplinärer Zusammenarbeit und den Herausforderungen einer langfristige Open-Access-Verfügbarkeit beantworten werden.


Konzept

Marie-Luise Pitzl, Ruth Osimk-Teasdale, Stefanie Riegler, Omar Siam, Hannes Pirker, Susanne Zhanial


Registrierung

Eine Anmeldung ist für Tag 1 oder Tag 2, oder für beide Tage (Achtung: zwei Anmeldungen erforderlich) möglich.

Registrierung Tag 1

Registrierung Tag 2


Programm

Tag 1 (Donnerstag, 28 April 2022)

14.00-14.10 Begrüßung

14.10-14.40 Sprachkorpora und die Herausforderung von Langzeit-Open Access am Beispiel von VOICE (Marie-Luise Pitzl, ACDH-CH)

14.40-15.00 Einführung in VOICE: Korpusstruktur und Texteigenschaften (Ruth Osimk-Teasdale, JKU; Stefanie Riegler, Uni Wien)

15.00-15.10 Das VOICE CLARIAH Projekt: Die Entwicklung von VOICE 3.0 Online (Marie-Luise Pitzl, ACDH-CH; Omar Siam, ACDH-CH)

15.10-15.30 Kaffeepause

15.30-16.00 Einführung in VOICE 3.0 Online

16.00-17.00 Praktische Übungen mit VOICE 3.0: Suchanfragen, Subkorpora, etc.

17.00-17.15 Abschlussdiskussion Tag 1

 

Tag 2 (Freitag, 29 April 2022)

10.00-10.15 Begrüßung und Zusammenfassung Tag 1

10.15-10.45 VOICE 3.0 XML und NoSketch Engine (Hannes Pirker, ACDH-CH)

10.45-11.15 Die technologische Infrastruktur hinter VOICE 3.0 Online (Omar Siam, ACDH-CH)
11:15-11.25 Demonstration: Anwendung der VOICE Technologie auf andere Daten (Omar Siam, ACDH-CH)

11.25–11.45 Diskussion: OA Technologien von VOICE und deren Wiederverwendbarkeit

11.45-12.15 Kaffeepause

12.15-13.00 Frage-Antwort-Runde und Abschlusspanel: Die Herausforderungen von Langzeit-Open-Access für Sprachkorpora, Projektmanagement und Interdisziplinarität.

13.00 Abschluss der Tool Gallery 8.1.



Datum

28. April 14:00 bis 17:15 Uhr

29. April 10:00 bis 13:00 Uhr


Ort

Online via Zoom