24.04.2023 | Digitale Ethik

“Daten sind die letzte Grenze für den Kolonialismus”

Die Digitalisierung kann das Verschwinden von bedrohten Sprachen bremsen, aber auch befördern. Der neuseeländische Informatiker Te Taka Keegan macht das am Beispiel der Sprache Māori deutlich. Er war kürzlich an der ÖAW zu Gast, um mit internationalen Expert:innen über die kulturellen Dimensionen einer digitalen Ethik zu sprechen. Im Interview erklärt Te Taka Keegan, warum er in ChatGPT eine Gefahr sieht und wie sich der kulturelle Schatz einer Sprache im digitalen Zeitalter bewahren lässt.

Te Taka Keega. © ÖAW/Elia Zilberberg

Kennen Sie Aotearoas? Nein? Das ist der Name für Neuseland in Māori, der ursprünglichen Sprache der Insel westlich von Australien. Tatsächlich sind es immer weniger Menschen, die diesen Namen kennen. Denn nur noch rund 200.000 Sprecher:innen sind in der Lage, sich in ihrem Alltag auf Māori zu verständigen.

Māori ist damit eine von tausenden bedrohten Sprachen. Die UNESCO schätzt, dass weltweit rund 2.450 Sprachen zu verschwinden drohen. Die Digitalisierung kann dieses Verschwinden aufhalten – aber auch beschleunigen, stellt Te Taka Keegan fest. Der neuseeländische Informatiker, der selbst Māori spricht, war an der Österreichischen Akademie der Wissenschaften (ÖAW) zu Gast, um über “Cultural Dimensions of Digital Ethics” zu diskutieren.

Bei der Veranstaltung, organisiert von der ÖAW-Plattform Academies for Global Innovation and Digital Ethics (AGIDE), ging es darum, wie eine Ethik für das digitale Zeitalter beschaffen sein könnte, wenn sie die sozio-kulturelle Vielfalt der Welt ernst nimmt und aufgreift.

Programm der Veranstaltung


SPRACHE DER Māori ist bedroht

Wie viele Menschen sprechen Māori?

Te Taka Keegan: Māori wird in Neuseeland seit tausend Jahren gesprochen, während Englisch erst vor 200 Jahren angekommen ist. Man könnte also sagen, dass Māori die ursprüngliche Sprache Aotearoas (Neuseeland in Māori, Anm.) ist. Aber heute haben wir rund fünf Millionen Einwohner:innen und nur jede/r fünfte rechnet sich den Māori zu. Und nur einer von fünf Māori kann die Sprache unserer Vorfahren sprechen. Māorisch ist also selbst innerhalb der indigenen Bevölkerung eine Minderheitensprache.

Nur einer von fünf Māori kann die Sprache unserer Vorfahren sprechen. Māorisch ist selbst innerhalb der indigenen Bevölkerung eine Minderheitensprache."

Was wird getan, um die Sprache zu bewahren?

Te Taka Keegan: Ich setze mich zum Beispiel gemeinsam mit anderen Aktivist:innen dafür ein, Māori durch den Einsatz moderner Technologien zu bewahren. Wenn digitale Werkzeuge in einer Sprache zur Verfügung stehen, wird sie häufiger verwendet und die Menschen bekommen neue Hilfsmittel an die Hand, um sie zu erlernen. In der digitalen Sphäre können sich die Sprecher:innen zudem einfach vernetzen. Daneben gibt es eine ganze Reihe von weiteren Initiativen, um unsere Sprache zu bewahren, zu revitalisieren und lebendig zu halten. Mein Fokus liegt auf Technologie, mit dem Ziel, dass Māori digitale Werkzeuge in ihrer eigenen Sprache nutzen können und nicht auf Englisch wechseln müssen. Das beinhaltet heute vor allem auch den Zugang zu modernen Sprachverarbeitungssystemen, zum Beispiel für soziale Medien und künstliche Intelligenz.

Wie hat sich die Zahl der Sprecher:innen zuletzt entwickelt?

Te Taka Keegan: Das ist schwer zu sagen. Was wir wissen, ist, dass nur noch etwa 200.000 Menschen in der Lage sind, ein alltägliches Gespräch auf Māori zu führen. Das ist nicht genug. Für die indigene Bevölkerung geht es hier nicht nur um Sprache, sondern um unsere Identität und die Verbundenheit zu unseren Vorfahren. Viele von uns sind traurig, dass sie Māori nicht mehr sprechen können. Deshalb ist es wichtig, die Sprache so oft wie möglich zu nutzen, um sie zu revitalisieren.

Maorisch kennt keine eigene Schrift. Die Entwicklung der Schriftsprache mit lateinischen Buchstaben war wichtig, um unsere Sprache auch digital in Schriftform repräsentieren zu können."

Warum gibt es nur noch so wenige Sprecher:innen?

Te Taka Keegan: Das hängt vor allem mit dem Schrumpfen der indigenen Bevölkerung durch die Kolonialisierung und politischer Unterdrückung zusammen. Im Zuge der Kolonialisierung wurde den Māori ihr Land gestohlen, es wurden gefährliche Krankheiten eingeschleppt, die Epidemien ausgelöst haben, und viele von uns wurden in den Krieg geschickt und sind gefallen, vor allem in Übersee. Als die Siedler:innen den ersten Vertrag mit den Māori abgeschlossen haben, waren diese 8 zu 1 in der Überzahl. Innerhalb von 50 Jahren hat sich das Verhältnis umgedreht. Dann gab es lange grausame Gesetze zur Unterdrückung der Māori: Bildung gab es nur auf Englisch und das Sprechen von Māori und das Befolgen traditioneller Bräuche wurde bestraft. Die Menschen haben sehr gelitten. Erst seit kurzem gibt die Regierung zu, dass ihr Verhalten ungerecht war und versucht, Wiedergutmachung für die Fehler der Vergangenheit zu leisten.

CHATGPT keine Lösung für Spracherhalt

Wie gut eignet sich das lateinische Alphabet zum Schreiben von Māori?

Te Taka Keegan: Maorisch kennt traditionell keine eigene Schrift. Wir haben eine lange mündliche Tradition, die unsere Geschichte erzählt. Information wurde vor allem über Lieder, Sprechgesang, Gebete und Geschichten über die Vorfahr:innen vermittelt. Als die ersten Missionare in Aotearoa angekommen sind, haben sie mit ihren Bibeln die Schrift in unsere Kultur eingeführt. Die Linguist:innen haben dann gute Arbeit geleistet bei der Entwicklung der Schriftsprache mit lateinischen Buchstaben. Das war lange wichtig, um unsere Sprache auch digital in schriftlicher Form repräsentieren zu können. Aber mittlerweile gibt es neue Möglichkeiten der Spracherkennung, die es vielleicht möglich machen, unsere Sprache digital neu zu erfinden und wieder zur traditionellen, mündlichen Tradition zurückzuführen.

Warum ist die Verfügbarkeit von digitalen Werkzeugen in Māori so wichtig?

Te Taka Keegan: Digitale Technik ist gerade unter jungen Leuten allgegenwärtig. Die Jugend ist die Zukunft unserer Sprache und wenn wir ihr wichtige Werkzeuge in Māori zur Verfügung stellen, kann das helfen, das Überleben der Sprache sicherzustellen. Durch technische Fortschritte können junge Menschen die Sprache auch wieder öfter hören, indem sie mit ihren Computern sprechen. Es gibt mittlerweile einige interessante Projekte, die Systeme Spracheingabe und -synthese in Māori entwickeln.

ChatGPT funktioniert auf Māori. Aber diese Daten werden aus sozialen Netzwerken abgesaugt, ohne die Zustimmung der Urheber:innen einzuholen."

KI-basierte Systeme wie ChatGPT können hier helfen?

Te Taka Keegan: ChatGPT funktioniert auf Māori, aber das ist mit einigen Problemen behaftet. Wir möchten Systeme, die nicht nur übersetzen können, sondern nativ in Māori entwickelt werden. Ein entscheidender Punkt ist, auf Basis welcher Daten ChatGPT eine Sprache lernt. Diese Daten werden aus sozialen Netzwerken abgesaugt, ohne die Zustimmung der Urheber:innen einzuholen. Solche Daten repräsentieren aber nicht die ganze Breite einer Sprache und bringen Fehler und Simplifizierungen mit, die die Entwicklung von Māori negativ beeinflussen können. Auf den ersten Blick ist die Māori-Unterstützung von ChatGPT großartig, aber wenn man etwas tiefer blickt, ist es erschreckend. Unsere Angst ist, dass solche Systeme sehr häufig genutzt werden, weil sie scheinbar so gut funktionieren.

DIGITALE TECHNIK VON Māori für Māori

Was kann man dagegen tun?

Te Taka Keegan: Wir möchten, dass die Māori-Unterstützung von ChatGPT und Co entfernt wird. Unsere Sprache ist ein kultureller Schatz, der an uns weitergegeben wurde. Wir möchten uns selbst darum kümmern, indem wir ein eigenes System bauen, das mit unseren Daten trainiert wird und bessere Ergebnisse liefert. Wir wollen nicht, dass diese wichtige Ressource in den Händen von Konzernen liegt, die lediglich Profit machen wollen.

Wir müssen unsere Daten schützen und unsere eigenen digitalen Werkzeuge bauen, wenn wir nicht ausgenutzt werden wollen."

Sehen Sie einen Zusammenhang mit der Kolonialgeschichte?.

Te Taka Keegan: Ja, Daten sind die letzte Grenze für den Kolonialismus. Jedes KI-System basiert am Ende auf großen Datenmengen. Wir müssen unsere Daten schützen und unsere eigenen digitalen Werkzeuge bauen, wenn wir nicht ausgenutzt werden wollen. Das neuseeländische Medienhaus “Te Hiku Media” hat zum Beispiel eine Speech-to-Text-Lösung gebastelt auf Basis von Sprachproben, die von der lokalen Gemeinschaft beigesteuert wurden. Te Hiku Media beweist damit, dass auch generative Systeme wie ChatGPT von Māori für Māori entwickelt werden können. Das sollte der nächste Schritt sein.

Kann eine Sprache ohne Repräsentation in der digitalen Welt überleben?

Te Taka Keegan: Sprache dient der Kommunikation. Wenn die Menschen sich über Smartphones und Computer vernetzen, muss die Sprache ihnen folgen. Was die Situation von Māori angeht, bin ich Optimist. Wann hat ein Pessimist schon jemals etwas Gutes geschaffen, oder überhaupt irgend etwas? Technologie und die Souveränität über unsere Daten und Werkzeuge können uns helfen, unsere Zukunft selbst zu gestalten. Durch neue Möglichkeiten wie KI-Systeme haben wir das Momentum auf unserer Seite und wir sollten in der Lage sein, unser kulturelles Erbe besser zu schützen.

 

AUF EINEN BLICK

Te Taka Keegan ist Informatiker und forscht an University of Waikato (Te Whare Wānanga o Waikato) in Neuseeland. Er promovierte zum Thema „Indigenous Language Usage in a Digital Library: He Hautoa Kia Ora Tonu Ai“ und ist aktuell Associate Professor an der Fakultät für Computing & Mathematical Sciences. Er war u.a. wissenschaftlich beteiligt am Aufbau von Google-Übersetzungsprogrammen in Māori.