Archiv der Kategorie: Sprachen

Meine erste Korrektur einer maschinellen Übersetzung

Maschinelle Übersetzung

Im Oktober 2018 hatte ich einen interessanten Auftrag erhalten: die Korrektur einer maschinellen Übersetzung auf Spanisch, mit Ausgangsprache Englisch. Manche Übersetzer wollen davon nichts wissen, ich jedoch finde, dass die maschinelle Übersetzung gar nicht mehr wegzudenken ist und dass im Gegenteil ihre Anwendung eher zunehmen wird. Das heißt aber nicht, dass die maschinellen Übersetzungen so weit sind, dass man sie auch veröffentlichen kann. So weit sind sie nicht, und deswegen bin ich fest davon überzeugt, dass wir ÜbersetzerInnen noch viel zu tun haben werden.

Als Forschungsgebiet gehört die maschinelle Übersetzung der Computerlinguistik und ist ein Teilbereich der künstlichen Intelligenz. Die menschliche Übersetzung ist Gegenstand der angewandten Sprachwissenschaft.
Übersetzung

Postedition

Der Fachbegriff für diese Art Korrektur nennt man Postedition, also das Editieren eines Textes nachdem er durch eine Maschine übersetzt worden ist. Dieser kurzer Beitrag von textmaster.de beschreibt die Postedition ebenfalls.

Der Auftrag

Der Auftrag war ein Booklet aus dem Englischen, welches der Kunde in die spanische Sprache über die maschinelle Übersetzung hat übersetzen lassen. Das Ergebnis konnte man lesen, aber es war natürlich an vielen Stellen holprig bis fehlerhaft. Es ging um Finanzen und die Entwicklung einer neuen App, und abgesehen von ein paar Fachbegriffe, war der Text stilistisch nicht anspruchsvoll. Aber insgesamt habe ich drei Hauptschwäche festgestellt:

  1. Da der Ausgangstext im Englischen war, hat die maschinelle Übersetzung ständig zwischen (Du) und usted (Sie) gewechselt, also zwischen Duzen und Siezen. Warum, konnte ich nicht ganz erkennen, also habe ich mich für die Anrede auf Spanisch entschieden, damit der Text einheitlich war.
  2. Die maschinelle Übersetzung konnte auch nicht zwischen Synonymen unterscheiden. Zum Beispiel bei den Adjektive misleading, deceiving und blurring hat sie jeweils nur dreimal hinereinander engañoso übersetzt.
  3. Sie kann auch Redewendungen nicht richtig übersetzen. Zum Beispiel fresh as a cucumber. Auf Spanisch ist es nicht fresco como un pepino sondern fresco como una lechuga oder fresco como una rosa.

Mein Fazit ist, dass wir als ÜbersetzerInnen keine Angst haben müssen vor Google Translate, DeepL oder anderen weiteren Diensten, die noch kommen mögen. Man kann eigentlich das Gegenteil sehen: dass es eine gute Nachricht ist, dass sie da sind, denn mit ihnen werden wir noch viel zu tun haben. Wer mehr über das Thema erfahren und es vertiefen möchte, kann hier (auf Französisch) weiter lesen.

Weltsprachen und zweitmeist gesprochene Sprachen

Der Begriff der Weltsprachen

Es gibt zwei Hauptdefinitionen für das Konzept der Weltsprachen:

  • einerseits sind Weltsprachen international benutzte Verkehrsprachen, deren Nutzung weit über ihr Ursprungslang reichen,
  • andererseits definieren sich Weltsprachen nach der Anzahl ihrer Sprecher.

Weltsprache als Verkehrssprache

Der ersten Definition nach ist die englische Sprache natürlich die erste Weltsprache überhaupt, obwohl sie weniger Sprecher hat als beispielsweise Chinesisch oder Arabisch. Als Verkehrsprache ist Englisch zur Lingua Franca unserer Zeit geworden, so wie früher diese Rolle das Latein in Europa inne hatte.

Weltsprache als meistgesprochene Sprache

Aber was ist mit der zweiten Definition? Die Weltsprachen werden nach der Zahl der Sprecher gezählt, wobei hier sowohl Muttersprachler als auch Sprecher einer Zweitsprache zählen. Diese Zweitsprache muss aber von diesen Sprechern im Alltag gesprochen bzw. verwendet werden. Man zählt also nicht alle Fremdsprachen, die die Bevölkerung beherrscht, sondern nur diejenigen, die im Alltag wirklich Verwendung finden.

Auf der Webseite Statista finden wir eine Liste der meistgesprochenen Sprachen der Welt, die nach der zweiten Definition als Weltsprachen gelten. Diese sind, kurz zusammengefasst:

  • Chinesisch, mit etwa 1,300 Millarden Sprecher
  • Hindi (525 Millionen, Amtssprache in Indien) und Englisch (510 Millionen)
  • Spanisch (389 Millionen)
  • Arabisch (290 Millionen)
  • Russisch (278 Millionen) und Portugiesisch (270 Millionen)
  • Bengali (250 Millionen, Amtsprache in Bangladesch und Indien) und Malaiisch-Indonesisch (200 Millionen, gesprochen in Malaysia, Indonesien, Singapur, Brunei)
  • Urdu (150 Millionen, Amtsprache in Pakistan und Indien)
  • Japanisch (127 Millionen)
  • Deutsch (118 Millionen) und Französisch (107 Millionen)

Die Welt betrachtet mit den zweitmeist gesprochenen Sprachen

Die Hauptsprache bestimmt das Bild, dass wir von einem Land haben. Jede(r) weiß, dass in Kanada Englisch gesprochen wird;  dass in Mexiko Spanisch gesprochen wird usw. Im Gegensatz dazu ist nicht jedem bewusst oder denkt nicht sofort daran, dass in Kanada auch zumindest Französisch gesprochen wird und in Spanien Baskisch oder in Mexiko Nauhatl.

Weltsprachen

Zweitmeist gesprochenen je nach Kontinenten

Ein anderer Ansatz, auf die Länder der Welt zu schauen verfolgt das Portal MovHub.com, das bei internationalen Umzügen hilft. MovHub hat ein paar Infografiken veröffentlicht, die alle zweitmeist gesprochenen Sprachen überall auf der Welt zeigen. Diese Infografiken visualisieren ganz gut, dass in allen Ländern mehr als eine Sprache gesprochen wird, obwohl oft nur eine einzige als offizielle Sprache anerkannt ist.

Ich habe die Infografiken auf CULTURA INQUIETA gefunden und fasse sie hier kurz zusammen:

In Amerika

  • In Kanada ist die zweitmeist gesprochene Sprache Französisch, vorwiegend gesprochen in der Region Québec. Französisch und Englisch sind überall in Kanada, nicht nur in Québec Amtssprache.
  • In den USA ist die zweitmeist gesprochene Sprache Spanisch. Obwohl die spanische Sprache keine Amtssprache ist, lebt in den USA die zweitgrößte Spanisch sprechende Bevölkerung der Welt, hauptsächlich in Florida, im Südwesten der USA und im Nordosten. In Puerto Rico, laut Wikipedia ein nichtinkorporiertes US-amerikanisches Außengebiet, haben 95% der Bevölkerung Spanisch als Muttersprache.
  • Nahuatl ist in Mexiko die zweitmeist gesprochene Sprache. In vorspanischer Zeit wurde Nahuatl von den Azteken, Tolteken und nahen Völkern gesprochen. Immerhin etwa 1,5 Millionen Sprecher hat heute die Sprache Nahuatl.
  • In Argentinien ist die zweitmeist gesprochene Sprache Italienisch. Allerdings gerade einmal 1,5 Millionen Personen sprechen geschätzt Italienisch von ca. 43 Millionen Einwohnern in Argentinien .
  • Puerto Rico: Englisch
  • Quechua ist in Ecuador, Peru und Bolivien die zweitmeist gesprochene Sprache. In den drei genannten Ländern ist Quechua sogar Amtssprache. Quechua war die Sprache des Inkareiches in vorspanischer Zeit. Mit der Expansion des Reiches im 16. Jahrhundert, kurz vor der spanischen Invasion, wurde Quechua die Lingua Franca im Andenraum.
  • In Paraguay ist die zweitmeist gesprochene Sprache Guaraní, die zusammen mit Spanisch  Amtssprache ist.

In Europa

  • Polnisch ist in Großbritannien die zweitmeist gesprochene Sprache. Infolge der osteuropäischen EU-Erweiterung hat sich die polnische Sprache diesen Status erst seit dem Jahr 2004 erarbeitet.
  • In Frankreich, Italien, Polen, Ungarn, Norwegen und Schweden ist die zweitmeist gesprochene Sprache Englisch.
  • Schwedisch ist in Finnland die zweitmeist gesprochene Sprache. Das Schwedische in Finnland hat vor allem geschichtliche Hintergründe: Finnland war über fast 700 Jahre Teil des Königsreichs Schwedens (12. – 19. Jahrhundert).
  • In Deutschland ist die zweitmeist gesprochene Sprache Türkisch. Erst als die Sprache der Gastarbeiter ins Land gekommen, ist Türkisch heute die Sprache der Migranten.
  • Kurdisch ist in der Türkei die zweitmeist gesprochene Sprache. Kurdisch gehört zur indogermanischen Sprachfamilie und wird im Osten der Türkei, im Norden Syriens sowie Iraks und im Nordwesten Irans gesprochen.
  • Katalanisch ist in Spanien die zweitmeist gesprochene Sprache. Zudem in den drei Autonomen Regionen Katalonien, València und die Balearen ist Katalanisch Amtsprache.

In Asien

  • Bengali ist in Indien die zweitmeist gesprochene Sprache. 215 Millionen Muttersprachler sprechen Bengali, welches zur indogermanischen Sprachfamilie gehört; davon 75 Millionen in Indien. Überdies ist Bengali Amtssprache in Bangladesch, dort ist Bengali Hauptsprache.
  • Im Irak: Kurdisch
  • In China ist die zweitmeist gesprochene Sprache Kantonesisch. Die Sprache Yue, wie die kantonesische Sprache auch bezeichnet wird, gehört zur sinotibetischen Sprachfamilie und wird vorwiegend im Süden Chinas gesprochen. Dessen ungeachtet, ist die Kantonesische Sprache keine Variante und kein Dialekt der hochchinesischen Sprache.
  • In Australien ist die zweitmeist gesprochene Sprache Mandarin. Mandarin gehört auch zur sinotibetischen Sprachfamilie und bildet die Grundlage für das standarisierte Hochchinesisch. Auf Grund von Einwanderung aus China und Südostasien ist das Mandarin nach Australien gelangt.

Finden Sie nicht, nach dieser kurzen Liste sieht man die Welt mit anderen Augen? :-)