index










Adresse: Sonnenfelsgasse 19/8, 1010 Wien
Kontakt: +43 1 51581-2300, E-mail


Das Institut für Corpuslinguistik und Texttechnologie (ICLTT) erforscht auf einer breiten empirischen Grundlage umfangreiche Textcorpora, die im „AAC - Austrian Academy Corpus“ zusammengefasst sind. Dabei werden die Entstehung und der Gebrauch von Wörtern und komplexen sprachlichen Ausdrücken in Texten, der historische Wandel von Bedeutungen und sprachlichen Formen und die Rezeption von Texten in interkulturellen Kontexten (inkl. Übersetzungen) untersucht. Die texttechnologische Forschungsarbeit ist der formalen Modellierung von Sprachprozessen und Sprachstrukturen und der Entwicklung integrierter Annotationsverfahren und anderer Texttechnologien gewidmet. Die corpusphilologische Forschung behandelt literatur- und kulturwissenschaftliche Themen sowie die Erstellung digitaler, multimedialer Editionen als Teil des sprachlich-kulturellen Erbes.
Die im AAC zur Zeit vorliegenden Corpora enthalten in erster Linie Texte in deutscher Sprache, die primär den Zeitraum von 1848 bis 1989 abdecken, die unterschiedliche Textsorten repräsentieren (von literarischen Texten bis hin zu Fachtexten und Gebrauchstexten), und einen Bezug zu Österreich bzw. bis 1918 zur Habsburger-Monarchie aufweisen. Auf quantitativer Ebene umfasst der AAC-Container zahlreiche Teilcorpora mit insgesamt ca. 500 Millionen Wörtern (tokens). In den kommenden Jahren wird das AAC-Gesamtcorpus weiter ausgebaut, wobei die Untersuchung der aktuellen Gegenwartssprache wie auch frühere historische Sprachperioden in den Mittelpunkt des Forschungsinteresses rücken.
Mit einem interdisziplinär ausgerichteten Ansatz möchte das ICLTT dazu beitragen, dass die Corpuslinguistik eine Schlüsselrolle in der geisteswissenschaftlichen Forschung spielt, was u.a. im europäischen Projekt CLARIN (Common Language Resource and Technology Infrastructure) und in dessen österreichischem Sub-Netzwerk CLARIN-AT (mit Unterstützung des Bundesministeriums für Wissenschaft und Forschung) umgesetzt wird.

Impressum
Medieninhaber: Österreichische Akademie der Wissenschaften, Juristische Person öffentlichen Rechts (BGBl 569/1921 idF BGBl I 130/2003), Dr. Ignaz Seipel-Platz 2, 1010 Wien. Homepage-Betreiber: Institut für Corpuslinguistik und Texttechnologie (ICLTT), Sonnenfelsgasse 19/8, 1010 Wien. Diese Website dient zur Information über die wissenschaftlichen Aktivitäten des Instituts für Corpuslinguistik und Texttechnologie (ICLTT) der Österreichischen Akademie der Wissenschaften und setzt somit den gesetzlichen Auftrag um, die Wissenschaft in jeder Hinsicht zu fördern.
[Jan 2013]