SEO//13 Min. Lesezeit

Machine Translation Post-Editing (MTPE): Best Practices für Qualität

Eray Gündoğmuş
Teilen

Machine Translation Post-Editing (MTPE): Best Practices für Qualität

Machine Translation Post-Editing (MTPE) hat sich von einem experimentellen Workflow zur gängigen Praxis der Lokalisierungsbranche entwickelt. Da die Qualität der maschinellen Übersetzung – insbesondere durch neuronale MT-Systeme von DeepL, Google, Microsoft und spezialisierten Engines – stetig gestiegen ist, lautet die Frage nicht mehr „Sollten wir MT einsetzen?", sondern „Wie nutzen wir es effektiv?"

MTPE bezeichnet die Praxis, eine maschinell generierte Übersetzung als Ausgangspunkt zu verwenden und anschließend von menschlichen Übersetzern überprüfen und korrigieren zu lassen, bis das erforderliche Qualitätsniveau erreicht ist. Bei richtiger Anwendung können Übersetzungskosten um 30–50 % gesenkt und Durchlaufzeiten erheblich verkürzt werden. Bei schlechter Umsetzung entstehen inkonsistente, fehleranfällige Inhalte, die der Marke und dem Nutzervertrauen schaden.

Dieser Leitfaden behandelt den vollständigen MTPE-Workflow – von der Auswahl der MT-Engine über die Qualitätsmessung bis hin zur Prozessoptimierung.

Das MTPE-Qualitätsspektrum

Nicht alle MTPE-Prozesse sind gleich. Die Branche unterscheidet zwischen zwei Hauptansätzen:

Light Post-Editing (LPE)

Light Post-Editing zielt auf „ausreichend gute" Qualität ab – eine Ausgabe, die korrekt und verständlich, aber nicht unbedingt stilistisch ausgefeilt ist. Das Ziel ist Korrektheit, nicht Stil.

LPE-Richtlinien weisen Editoren typischerweise an:

  • Fehler zu beheben, die die Bedeutung verändern oder zu Missverständnissen führen
  • Grammatikfehler zu korrigieren, die das Verständnis beeinträchtigen
  • den Stil NICHT zu verbessern, Sätze NICHT umzustrukturieren und keine Markensprache anzuwenden
  • kleinere Ungereimtheiten NICHT zu korrigieren, wenn die Bedeutung klar ist

LPE eignet sich für: interne Dokumentation, umfangreiche Inhalte mit kurzer Lebensdauer, zusammenfassende Übersetzungen für den Informationszugang.

Full Post-Editing (FPE)

Full Post-Editing zielt auf eine Übersetzungsqualität ab, die der konventionellen menschlichen Übersetzung entspricht. Das Ergebnis sollte von einer von Grund auf neu erstellten Übersetzung nicht zu unterscheiden sein.

FPE-Richtlinien weisen Editoren an:

  • alle Fehler zu beheben (Genauigkeit, Grammatik, Stil, Terminologie)
  • Markensprache und Tonalitätsvorgaben anzuwenden
  • sicherzustellen, dass die Terminologie mit dem genehmigten Glossar übereinstimmt
  • Sätze umzustrukturieren, wo die MT-Ausgabe unnatürlich oder holprig wirkt

FPE eignet sich für: kundenorientierte Inhalte, Marketing, Rechtsdokumente, Produkt-UI, hochsichtbare Inhalte.

Die richtige MT-Engine auswählen

Die Wahl der MT-Engine beeinflusst den Post-Editing-Aufwand und die Gesamtqualität erheblich. Wichtige Überlegungen:

Allgemeine vs. domänenspezifische Engines

Allgemeine Engines (Google Translate, DeepL, Microsoft Translator) liefern für ein breites Spektrum an Inhaltstypen gute Ergebnisse. Sie sind ein vernünftiger Ausgangspunkt für die meisten Lokalisierungsprogramme.

Domänenspezifische oder individuell trainierte Engines können allgemeine Engines bei spezialisierten Inhalten deutlich übertreffen:

  • Rechtlich: Rechtsspezifische MT-Engines, die auf Fallrecht und Rechtsdokumenten trainiert wurden
  • Medizinisch: Medizinische MT-Engines, die auf klinischer Literatur und Arzneimittelinformationen trainiert wurden
  • Technisch: Engines, die auf Produktdokumentation und technischen Handbüchern trainiert wurden

Das Training einer eigenen Engine erfordert typischerweise 500.000+ hochwertige Satzpaare in der jeweiligen Domäne.

Die Qualität von Sprachpaaren variiert stark

MT-Qualität ist nicht bei allen Sprachpaaren einheitlich. „High-resource"-Sprachpaare mit reichlich Trainingsdaten (Englisch↔Französisch, Englisch↔Deutsch, Englisch↔Spanisch, Englisch↔Chinesisch) schneiden deutlich besser ab als „Low-resource"-Paare (Englisch↔Nepalesisch, Englisch↔Zulu, Englisch↔Isländisch).

Bevor Sie sich für einen MT+MTPE-Workflow für ein Sprachpaar entscheiden, führen Sie einen Pilot durch:

  1. Übersetzen Sie 1.000–2.000 Wörter repräsentativen Inhalts
  2. Lassen Sie einen qualifizierten Übersetzer die rohe MT-Ausgabe bewerten
  3. Messen Sie den geschätzten Post-Editing-Aufwand im Vergleich zur Übersetzung von Grund auf
  4. Berechnen Sie die Kosteneffizienz anhand der tatsächlichen Post-Editing-Zeit

MT-Bewertungsmetriken

Verwenden Sie bei der Bewertung von MT-Engines eine Kombination aus:

BLEU-Score: Automatisierte Metrik, die MT-Ausgaben mit menschlichen Referenzübersetzungen vergleicht. Nützlich für den Vergleich von Engines, aber als alleiniger Qualitätsindikator nicht zuverlässig.

COMET: Neuronale MT-Qualitätsschätzungsmetrik, die besser mit menschlichen Urteilen korreliert als BLEU. Wird in der Branche zunehmend bevorzugt.

Menschliche Bewertung: Lassen Sie einen qualifizierten Linguisten eine Stichprobe der MT-Ausgabe auf einer Skala von 1–5 nach Adäquatheit (ist die Bedeutung erhalten?) und Flüssigkeit (liest es sich natürlich?) bewerten.

Post-Editing-Aufwand: Die operativ nützlichste Metrik – messen Sie die Zeit, die Post-Editoren benötigen, um die MT-Ausgabe auf die erforderliche Qualität zu bringen, im Vergleich zur Übersetzung von Grund auf.

Den MTPE-Workflow aufbauen

Vorbereitung vor der Übersetzung

Bevor MT auf Ihre Inhalte angewendet wird:

Terminologieintegration: Speisen Sie Ihr genehmigtes Glossar in die MT-Engine ein (die meisten Engines unterstützen Terminologieglosssare). Dies reduziert Terminologiefehler erheblich und beschleunigt das Post-Editing.

Translation Memory-Nutzung: Wenden Sie Ihr bestehendes TM vor dem MT-Schritt an. Exakte Treffer und hohe Fuzzy-Matches aus dem TM sind günstiger und von höherer Qualität als MT-Ausgaben. Senden Sie nur die verbleibenden Segmente (neue oder niedrig übereinstimmende Inhalte) an die MT-Engine.

Quelltextprüfung: Bereinigen Sie den Quelltext vor der MT-Verarbeitung. Tippfehler, inkonsistente Terminologie und komplexe Satzstrukturen verschlechtern die MT-Ausgabequalität. Lesen Sie unseren Leitfaden zu Übersetzungskontext und Quellqualität.

Content-Filterung: Einige Inhaltstypen liefern unabhängig von der Engine-Qualität schlechte MT-Ausgaben: stark kreative Inhalte, Wortspiele, kulturelle Referenzen, idiomatische Ausdrücke. Markieren Sie diese für menschliche Übersetzung statt MTPE.

Post-Editing-Richtlinien

Entwickeln Sie klare, schriftliche Post-Editing-Richtlinien für jeden Inhaltstyp und jede Qualitätsstufe. Die Richtlinien sollten festlegen:

  • Zu behebende Fehlertypen: Pflichtkorekturen (Genauigkeitsfehler, kritische Terminologie) vs. optionale Verbesserungen (Stil, Fluss)
  • Was NICHT zu tun ist: Häufige Over-Editing-Verhaltensweisen, die den Workflow verlangsamen, ohne die Qualität zu verbessern
  • Terminologieanforderungen: Umgang mit unbekannten Begriffen, Markennamen, Produktnamen
  • Formatierungsregeln: Wann MT-Formatierungen beibehalten und wann angepasst werden sollen
  • Eskalationskriterien: Wann die MT-Ausgabe verworfen und von Grund auf neu übersetzt werden soll

Qualitätssicherungsintegration

MTPE erfordert systematische QA, um Muster von MT-Fehlern zu erkennen:

Linguistische Qualitätssicherung (LQA): Stichprobenbasierte Überprüfung post-editierter Inhalte durch einen erfahrenen Linguisten. Identifizieren Sie Fehlerkategorien (Terminologie, Grammatik, Stil) und verfolgen Sie diese auf Schwächen der MT-Engine oder Lücken der Post-Editoren zurück.

Automatisierte QA-Tools: Tools wie Xbench, Verifika oder integrierte TMS-QA prüfen auf:

  • Terminologieinkonsistenz gegenüber dem Glossar
  • Nicht übersetzte Segmente
  • Formatierungsfehler
  • Zahlen- und Datumsformatprobleme
  • Interpunktionsfehler

Post-Editing-Aufwandsverfolgung: Verfolgen Sie die Zeit pro Segmenttyp, um Inhaltskategorien zu identifizieren, in denen MT keine Produktivitätsgewinne erzielt.

Post-Editoren schulen

Post-Editing ist eine eigenständige Fertigkeit, die sich vom Übersetzen unterscheidet. Gute Übersetzer werden nicht automatisch zu guten Post-Editoren. Das häufige Versagensmuster ist „Over-Editing" – denselben Aufwand wie bei einer vollständigen menschlichen Übersetzung betreiben und damit die Kosteneinsparungen zunichte machen.

Effektive Post-Editor-Schulungen umfassen:

MT-Stärken und -Schwächen verstehen: Welche Fehlertypen sind bei dieser Engine/diesem Sprachpaar häufig? Welche Fehlertypen bewältigt die Engine gut?

Mit der Post-Editing-Mentalität arbeiten: Das Ziel ist es, Fehler effizient zu beheben, nicht die Ausgabe über das erforderliche Qualitätsniveau hinaus zu verbessern. Widerstehen Sie dem Drang, Sätze umzuschreiben, die ausreichend, aber nicht ideal sind.

Tastaturkürzel und CAT-Tool-Effizienz: Post-Editoren arbeiten schneller, wenn sie ihr CAT-Tool beherrschen. Tastenkürzel zum Akzeptieren von Segmenten, häufige Ersetzungen und QA-Funktionen sind wichtig.

Zeiterfassung und Produktivitätsziele: Post-Editoren sollten ihre Produktivitäts-Benchmarks kennen und darauf hinarbeiten.

Einen Vergleich verschiedener Übersetzungsansätze finden Sie unter KI-Übersetzung vs. menschliche Übersetzung.

MTPE-Produktivität und -Qualität messen

Wichtige Produktivitätsmetriken

Wörter pro Stunde (WPH): Durchschnittliche Post-Editing-Geschwindigkeit. Branchen-Benchmarks:

  • Light Post-Editing: 2.000–3.000+ Wörter/Stunde
  • Full Post-Editing: 1.200–2.000 Wörter/Stunde
  • Menschliche Übersetzung von Grund auf: 500–800 Wörter/Stunde

Verfolgen Sie WPH nach Inhaltstyp, Sprachpaar und MT-Engine, um zu identifizieren, wo MTPE am effektivsten ist.

Post-Editing-Aufwand (PEE): Das Verhältnis der beim Post-Editing geänderten Zeichen zur Gesamtzeichenzahl. Wird von den meisten CAT-Tools automatisch berechnet. Niedrigerer PEE = weniger Bearbeitung = effektiveres MT.

Produktivitätsgewinn: Vergleichen Sie WPH für MTPE vs. menschliche Übersetzung beim gleichen Inhaltstyp. Wenn der Produktivitätsgewinn unter 30 % liegt, erbringt MT für diesen Inhaltstyp möglicherweise keinen ausreichenden Mehrwert.

Qualitätsmetriken

Wenden Sie Übersetzungsqualitätsmetriken systematisch auf MTPE-Ausgaben an:

MQM (Multidimensional Quality Metrics) oder LISA QA Model: Strukturierte Fehlertaxonomien zur Klassifizierung von Übersetzungsfehlern nach Typ und Schweregrad. Auf LQA-Stichproben aus post-editierten Inhalten anwenden.

Kundenseitiges Feedback: Überwachen Sie Nutzerfeedback, Support-Tickets und Bewertungen, in denen die Übersetzungsqualität erwähnt wird. Diese sind nachlaufende Indikatoren, spiegeln aber die reale Qualitätswahrnehmung wider.

A/B-Testing: Für hochvolumige Inhalte MT+MTPE-Ausgaben gegen menschliche Übersetzungen testen, um Konversionsrate, Engagement oder Support-Ticket-Raten zu messen.

Häufige MTPE-Fehler vermeiden

Pilot-Tests überspringen: Führen Sie MTPE für ein Sprachpaar oder einen Inhaltstyp niemals ohne einen Pilot ein, der den tatsächlichen Post-Editing-Aufwand misst.

Dieselben Richtlinien für alle Inhaltstypen verwenden: Light PE-Richtlinien für Marketing-Inhalte liefern unzureichende Ergebnisse. Unterschiedliche Inhaltstypen erfordern unterschiedliche Workflows.

Der MT-Engine keine Glossare bereitstellen: Terminologiefehler sind die häufigsten und schädlichsten MT-Fehler. Glossar-Integration ist nicht verhandelbar.

Post-Editor-Feedback ignorieren: Post-Editoren decken Muster von MT-Fehlern auf. Sammeln, analysieren und handeln Sie auf deren Feedback, um den Workflow zu verbessern.

MTPE anwenden, wo es wirtschaftlich keinen Sinn ergibt: Wenn der Post-Editing-Aufwand dem einer menschlichen Übersetzung entspricht, verursacht der MT-Schritt Kosten ohne Nutzen. Identifizieren Sie diese Fälle und leiten Sie sie direkt zur menschlichen Übersetzung weiter.

Vergessen, das Translation Memory zu aktualisieren: Post-editierte Segmente müssen zurück ins TM aufgenommen werden. Andernfalls geht der Lerneffekt aus dem Post-Editing-Aufwand verloren.

MTPE in Ihre Lokalisierungs-Pipeline integrieren

Moderne MTPE-Workflows integrieren sich in Translation-Management-Systeme und CI/CD-Pipelines:

  1. Quellinhalt wird ins TMS übertragen (manuell oder über i18n CI/CD-Automatisierung)
  2. TMS wendet TM-Nutzung an (exakte und Fuzzy-Matches aus früheren Übersetzungen)
  3. Verbleibende Segmente werden über API an die MT-Engine gesendet
  4. MT-Ausgabe wird Post-Editoren in der CAT-Tool-Oberfläche im TMS zugestellt
  5. Post-Editoren überprüfen und korrigieren Segmente
  6. LQA-Stichproben werden auf QA-Stichproben angewendet
  7. Genehmigte Übersetzungen werden exportiert und bereitgestellt

Achten Sie bei TMS-Plattformen auf folgende Unterstützung:

  • Direkte MT-Engine-API-Integrationen (kein manuelles Kopieren und Einfügen)
  • Post-Editing-Aufwandsverfolgung pro Segment
  • Produktivitätsberichte nach Editor und Inhaltstyp
  • Automatisierte QA mit Glossarprüfung

Globalisieren Sie Ihre App mit better-i18n

better-i18n kombiniert KI-gestützte Übersetzungen, git-native Workflows und globale CDN-Bereitstellung in einer entwicklerorientierten Plattform. Hören Sie auf, Tabellenkalkulationen zu verwalten, und beginnen Sie, in jeder Sprache zu veröffentlichen.

Kostenlos starten → · Features entdecken · Dokumentation lesen

Comments

Loading comments...