← Все статьи

Warum maschinelle Übersetzung so gut geworden ist

Noch 2014 produzierte Google Translate in jedem Satz lustige Fehler. Heute übersetzt es wissenschaftliche Artikel fast ohne Korrekturen. Was ist passiert?

Die "Wörterbuch-Übersetzer" Ära: 2000-2014

Frühere Übersetzer arbeiteten einfach: Sie nahmen eine riesige Datenbank paralleler Übersetzungen und wählten die häufigste Entsprechung. Das nennt man statistische maschinelle Übersetzung — SMT.

Das Problem: Die Maschine verstand keine Bedeutung. Sie sah nur Wörter und ihre Kombinationen. Einfache Sätze wurden gut übersetzt, komplexe wurden zu Kauderwelsch.

Die Revolution neuronaler Netze: 2016

2016 startete Google die Google Neural Machine Translation (GNMT). Statt statistischer Übereinstimmung begann das System, Kontext mit neuronalen Netzen zu "verstehen".

Sehr vereinfacht: Das neuronale Netz verwandelt eine Phrase in eine "Bedeutungswolke" (Mathematikvektor) und generiert dann aus dieser Wolke eine Phrase in einer anderen Sprache. Die Maschine übersetzt keine Wörter — sie übersetzt Bedeutungen.

Was ist ein Transformer

2017 erschien die Transformer-Architektur (dieselbe, die ChatGPT zugrunde liegt). Sie lernte, Verbindungen zwischen allen Wörtern eines Satzes gleichzeitig zu berücksichtigen. Die Maschine "sah" endlich lange Strukturen als Ganzes.

Warum DeepL meist besser ist als Google

DeepL wurde an einer kleineren, aber qualitativ besseren Textbasis trainiert — hauptsächlich professionelle Übersetzungen europäischer Sprachen. Daher klingen seine europäischen Übersetzungen (Deutsch, Französisch, Russisch) oft natürlicher. Bei seltenen Sprachen (Thai, Amharisch) ist Google Translate stärker — es hat mehr Daten.

Wo maschinelle Übersetzung noch versagt

  • Humor und Wortspiele — fast immer verloren
  • Literarische Texte — Poesie und Prosa mit Autorenstil
  • Fachbegriffe — Medizin, Recht
  • Mehrseitiger Kontext — Maschine "erinnert" sich nur an aktuellen Absatz
  • Kulturelle Bezüge — was in einer Kultur offensichtlich ist, braucht Erklärung in der anderen

Was kommt als Nächstes

Große Sprachmodelle (LLMs) wie GPT-4 und Claude übertreffen bereits klassische Übersetzer in der Qualität. Sie verstehen Kontext, können nachfragen, Stil anpassen. Vielleicht wird es bald keine separaten "Übersetzer" mehr geben — sondern universelle KI-Assistenten, für die Übersetzung nur eine von vielen Aufgaben ist.

Bis dahin — unser Rat

Verwenden Sie mehrere Übersetzer parallel. Auf unserer Seite können Sie mit einem Klick über Google, LibreTranslate und MyMemory übersetzen — vergleichen Sie Ergebnisse für wichtige Texte.

Поделиться статьёй