343 Stunden gesprochener Schweizer Dialekt, ein KI-Modell, viele Fragen. Wie sehr unterscheiden sich die Schweizer Dialekte voneinander? Und lassen sie sich mit KI vom Schweizerdeutschen ins Standarddeutsche übersetzen? «Ja, wir waren überrascht, wie gut das funktioniert hat», sagt Jan Deriu vom Zentrum für Künstliche Intelligenz der ZHAW.
In der Schweiz gibt es eine reiche Vielfalt an verschiedenen Dialekten, die als wichtige Marker der regionalen Identität gelten. In den deutschsprachigen Regionen werden schweizerdeutsche Dialekte in Alltagssituationen gesprochen – formell und informell – und vor allem in informellen Kontexten geschrieben. Ein kürzlich durchgeführtes SNF-Projekt hat die Deutschschweizer Landschaft in sieben Dialektregionen unterteilt: Basel, Bern, Zentralschweiz, Ostschweiz, Graubünden, Wallis und Zürich. Forschende der ZHAW und der FHNW erstellten ein grosses Korpus dieser Dialekte und trainierten darauf ein KI-Modell, das schweizerdeutsche Sprache in standarddeutschen Text übersetzt. Das Projekt lieferte Einblicke in die Herausforderungen bei der Entwicklung von Sprachübersetzungssystemen für Schweizerdeutsch, insbesondere in Bezug auf die Auswirkungen der Dialektvielfalt und die Unterschiede zwischen Schweizerdeutsch und Standarddeutsch. Der Beitrag des Projektteams wurde bei den Ergebnissen der Empirical Methods in Natural Language Processing (EMNLP 2023) in Singapur angenommen. Im Gespräch mit Johanna Seiwald stellt Jan Deriu, wissenschaftlicher Mitarbeiter am Zentrum für Künstliche Intelligenz, die wichtigsten Erkenntnisse vor.