|
|
 |
 |
 |
 |
13. März 2001
AAC & CO: Die Knoten im Netz der digitalen Textwelten
Akademien der Wissenschaften dreier Länder beschließen den Aufbau elektronischer Textcorpora als Basis für ein "Digitales Wörterbuch der deutschen Sprache"
 |

 |
|
Die Wissenschaftsakademien dreier Länder haben sich entschlossen, den Aufbau elektronischer Textcorpora als Grundlage für ein "Digitales Wörterbuch der deutschen Sprache des 20. Jahrhunderts" in inhaltlicher und technischer Abstimmung vorzunehmen. Eine gemeinsame Erklärung der Präsidenten der Berlin-Brandenburgischen Akademie der Wissenschaften, der Österreichischen Akademie der Wissenschaften (ÖAW) und der Schweizerischen Akademie der Geistes- und Sozialwissenschaften wurde am Montag, 12. März 2001, in der ÖAW unterzeichnet.
Ziel des länderübergreifenden Projekts ist es, in Berlin/Bern/Wien zentral und wissenschaftlich verbindlich, eine digitale Textwelt für die deutsche Sprache und Literatur des 19. und 20. Jahrhunderts in vertretbar kurzer Zeit auf höchstem technischen Niveau zu entwickeln, die man künftig für verschiedene Anwendungen, etwa Wörterbuchsysteme, elektronische Editionen oder linguistische Untersuchungen, öffentlich über das Internet wird nutzen können. Neben Zeugnissen der gedruckten Hochsprache werden in Zusammenarbeit der drei Akademien auch alltags-, gebrauchs- und fachsprachliche Bestände ausgewählt und digital aufbereitet werden.
AAC - Austrian Academy Corpus wird die digitale Textwelt heißen, die von der ÖAW in den nächsten Jahren aufgebaut werden soll. Elektronische Corpora sind umfangreiche und für Datenbanksysteme komplex strukturierte Sammlungen von Texten, die für das elektronische Medium (den Computer) "maschinenlesbar" gemacht wurden. Ihre Größe wird mit dem Speicherplatzbedarf oder mit der Anzahl der Wörter im Text (Running Words) angegeben. Als Corpus-Prototyp gilt das BNC (British National Corpus) mit 100 Millionen Running Words.
In den vergangenen zwei Jahrzehnten wurden in zahlreichen europäischen Staaten, so etwa in Frankreich, Großbritannien, Norwegen, Schweden, Slowenien, Spanien, Tschechien, elektronische Textcorpora zu den jeweiligen Nationalsprachen von akademischen Institutionen aufgebaut. Motiviert wurde der Aufbau dieser Corpora primär durch den staatlichen Willen, die jeweilige Nationalsprache umfassend zu dokumentieren und die Corpora für wissenschaftliche, primär linguistische, Folgeprojekte zur Verfügung zu stellen.
Weitere Informationen:
Dr. Evelyn Breiteneder, Kommission für literarische Gebrauchsformen, ÖAW
1010 Wien, Postgasse 7
Tel.: (+43 1) 51581/337, E-Mail: Evelyn.Breiteneder@oeaw.ac.at
|
|
 |