Inhaltsverzeichnis
KI-gestützte Übersetzungsworkflows: Von Machine Translation bis Post-Editing
Software zu übersetzen bedeutete früher, Tabellenkalkulationen an Übersetzungsagenturen zu schicken und wochenlang auf Ergebnisse zu warten. Heute haben KI-gestützte Übersetzungsworkflows die Art und Weise, wie Teams Lokalisierung angehen, grundlegend verändert – sie kombinieren Machine-Translation-Engines, automatische Qualitätsschätzung und strukturiertes Post-Editing in einer einzigen kontinuierlichen Pipeline. Aber rohe maschinelle Übersetzung allein erfüllt selten Produktionsstandards. Der eigentliche Durchbruch liegt in der Orchestrierung des gesamten Workflows: zu wissen, wann die MT-Ausgabe gut genug ist, wann sie leichte Bearbeitung benötigt und wann sie eine vollständige menschliche Überprüfung erfordert.
Dieser Leitfaden führt durch die End-to-End-KI-Übersetzungspipeline – von der rohen MT-Ausgabe bis hin zu produktionsbereitem lokalisierten Inhalt – und zeigt Ihnen, wie Sie einen Workflow aufbauen, der mit Ihrem Produkt skaliert.
Wichtigste Erkenntnisse
- KI-Übersetzungsworkflows kombinieren mehrere Phasen – Machine Translation, Qualitätsschätzung, Post-Editing und Review – in einer automatisierten Pipeline, die Inhalte anhand von Qualitätsschwellenwerten weiterleitet.
- Nicht alle Inhalte benötigen dasselbe Maß an menschlicher Überprüfung. Qualitätsschätzungstools können automatisch bestimmen, ob die MT-Ausgabe direkt veröffentlicht wird, leichte Bearbeitung benötigt oder vollständiges Post-Editing erfordert.
- Machine Translation Post-Editing (MTPE) ist der branchenübliche Ansatz, der MT als ersten Entwurf verwendet und dann gezielte menschliche Korrekturen anwendet – was Kosten und Durchlaufzeit im Vergleich zur Übersetzung von Grund auf reduziert.
- Continuous Localization integriert Übersetzung in Ihre CI/CD-Pipeline, sodass neue Strings inkrementell übersetzt werden, wenn Entwickler Code committen, und nicht in großen Batch-Übergaben.
- Übersetzungssoftware hat sich weit über den einfachen String-Austausch hinaus entwickelt. Moderne Tools verwenden kontextbewusste KI-Modelle, Translation Memory und Glossar-Durchsetzung, um deutlich bessere Erstdurchgangsergebnisse zu erzielen.
Was ist ein KI-gestützter Übersetzungsworkflow?
Ein KI-gestützter Übersetzungsworkflow ist eine strukturierte Pipeline, die Machine-Translation-Engines, Qualitätsschätzungsmodelle und Post-Editing-Prozesse nutzt, um Inhalte in großem Maßstab zu übersetzen und dabei Qualitätsstandards einzuhalten. Anstatt sich auf eine einzige MT-Engine zur Erzeugung der endgültigen Ausgabe zu verlassen, orchestriert er mehrere Phasen – jede mit definierten Qualitäts-Gates – um Inhalte durch das angemessene Maß an menschlicher Überprüfung zu leiten.
Die Evolution von Übersetzungsworkflows
Übersetzungsworkflows haben vier verschiedene Phasen durchlaufen:
Phase 1 — Vollständig manuell (vor den 2000ern): Übersetzer arbeiteten von Quelldokumenten ohne jede Automatisierung. Jeder String wurde von Grund auf übersetzt, selbst wenn identische Inhalte bereits zuvor übersetzt worden waren. Durchlaufzeiten wurden in Wochen oder Monaten gemessen.
Phase 2 — Translation Memory (2000er Jahre): Tools wie SDL Trados und MemoQ führten Translation-Memory-Datenbanken (TM) ein, die zuvor übersetzte Segmente speicherten. Wenn ein Übersetzer einem Satz begegnete, der einem bereits übersetzten ähnelte, schlug das TM die frühere Übersetzung vor. Dies reduzierte repetitive Arbeit, erforderte aber für jeden neuen String noch immer menschliche Übersetzer.
Phase 3 — MT-unterstützt (2010er Jahre): Statistische maschinelle Übersetzung (SMT) und später Neural Machine Translation (NMT) wurden als Erstdurchgangswerkzeug nutzbar. Übersetzer begannen, MT-Ausgaben als Ausgangspunkt zu verwenden, anstatt von Grund auf zu übersetzen. Google Translate und DeepL wurden zu gängigen Vorübersetzungsmaschinen. Die Workflows waren jedoch größtenteils manuell – Übersetzer entschieden selbst, was sie behalten und was sie neu schreiben wollten.
Phase 4 — KI-orchestriert (2020er Jahre–Gegenwart): Moderne Workflows nutzen KI nicht nur für die Übersetzung, sondern für das gesamte Pipeline-Management. Qualitätsschätzungsmodelle bewerten MT-Ausgaben automatisch. Routing-Regeln senden hochwertige Übersetzungen direkt zur Überprüfung, während Segmente mit geringer Konfidenz für vollständiges Post-Editing markiert werden. Translation Memory, Glossare und kontextbezogene Metadaten werden in die MT-Engine eingespeist, um die Erstdurchgangsqualität zu verbessern. Die menschliche Rolle verschiebt sich vom „Übersetzer" zum „Reviewer und Editor".
Die moderne KI-Übersetzungspipeline
Eine produktionsreife KI-Übersetzungspipeline führt Inhalte durch sechs Phasen. Hier ist, wie jede Phase funktioniert und was sie erzeugt:
Phase 1: Inhaltsextraktion
Quell-Strings werden aus Ihrer Codebasis, Ihrem CMS oder Ihrem Inhalts-Repository extrahiert. Bei der Software-Lokalisierung bedeutet dies typischerweise das Abrufen von Schlüssel-Wert-Paaren aus JSON-, YAML- oder XML-Dateien. Bei Marketing-Inhalten bedeutet es das Extrahieren von Absätzen, Überschriften und Metadaten aus CMS-Einträgen.
Wichtige Überlegungen:
- Kontext erhalten – Entwicklerkommentare, Screenshots oder Zeichenlimits neben jedem String einfügen
- Formatierung beibehalten – HTML-Tags, Variablen (wie
{userName}) und Pluralisierungsregeln müssen die Extraktion intakt überstehen - Status verfolgen – wissen, welche Strings seit dem letzten Übersetzungszyklus neu, geändert oder unverändert sind
Phase 2: Machine Translation
Extrahierte Strings werden an eine oder mehrere MT-Engines gesendet. Moderne Workflows verwenden oft mehrere Engines und wählen die beste Ausgabe pro Segment aus. Gängige MT-Anbieter sind Google Cloud Translation, DeepL, Amazon Translate und Azure Translator.
Was modernes MT auszeichnet:
- Kontextbewusste Modelle – neuere MT-APIs akzeptieren umgebende Sätze oder Kontext auf Dokumentenebene und erzeugen kohärentere Übersetzungen
- Glossar-Durchsetzung – Sie können ein Glossar produktspezifischer Begriffe (Markennamen, Feature-Namen, Fachjargon) bereitstellen, das die MT-Engine wörtlich verwenden muss
- Translation-Memory-Vorausfüllung – wenn eine TM-Übereinstimmung über einem bestimmten Schwellenwert vorhanden ist (üblicherweise 85–99 %), wird das TM-Ergebnis anstelle von MT verwendet, um zuvor genehmigte Übersetzungen zu erhalten
Phase 3: Qualitätsschätzung
Dies ist die Phase, die ein grundlegendes MT-Setup in einen echten KI-gestützten Workflow verwandelt. Qualitätsschätzungsmodelle (QE) bewerten MT-Ausgaben ohne sie mit einer menschlichen Referenzübersetzung zu vergleichen. Sie sagen Qualität auf der Grundlage erlernter Muster vorher.
QE-Modelle erzeugen:
- Segmentbewertungen – eine Konfidenzpunktzahl (üblicherweise 0–100) für jedes übersetzte Segment
- Wortebenen-Markierungen – spezifische Wörter oder Phrasen innerhalb eines Segments, die wahrscheinlich falsch übersetzt wurden
- Fehlerkategorievorhersagen – Klassifizierung wahrscheinlicher Fehler (Terminologie, Flüssigkeit, Genauigkeit, Stil)
Basierend auf diesen Bewertungen leitet der Workflow jedes Segment zur entsprechenden Post-Editing-Stufe weiter.
Phase 4: Post-Editing
Menschliche Übersetzer überprüfen und korrigieren MT-Ausgaben. Die Tiefe der Bearbeitung hängt von der in Phase 3 zugewiesenen Qualitätsstufe ab (Details zu jeder Stufe finden Sie im nächsten Abschnitt).
Phase 5: Review und Genehmigung
Bearbeitete Übersetzungen durchlaufen einen Überprüfungsschritt – typischerweise durch einen zweiten Linguisten oder einen Landesreviewer, der auf kulturelle Angemessenheit, Markenstimmungskonsistenz und kontextuelle Genauigkeit prüft.
Phase 6: Deployment
Genehmigte Übersetzungen werden zurück in das Quellsystem übertragen – sei es ein Code-Repository (via Pull Request), ein CMS (via API) oder ein Translation-Management-System, das mit Ihrer Produktionsumgebung synchronisiert.
Machine-Translation-Qualitätsstufen
Nicht jeder Inhalt erfordert dasselbe Maß an menschlicher Aufmerksamkeit. Ein gut konzipierter Workflow definiert Qualitätsstufen und leitet Inhalte basierend auf QE-Bewertungen, Inhaltstyp und Risikoniveau weiter.
Rohe Machine Translation (Stufe 1)
Was es ist: MT-Ausgabe, die direkt ohne menschliche Bearbeitung verwendet wird.
Wann zu verwenden:
- Interne Inhalte (Entwicklerdokumentation, interne Wikis, Support-Ticket-Triage)
- Nutzergenerierte Inhalte, bei denen Geschwindigkeit wichtiger ist als Perfektion (Community-Foren, Chat-Nachrichten)
- Gisting – wenn das Ziel das Verstehen der Bedeutung ist und kein publikationsreifer Text
- Extrem umfangreiche, risikoarme Inhalte, bei denen die Kosten der menschlichen Überprüfung den Geschäftswert übersteigen
Qualitätserwartungen: Bedeutung wird in der überwiegenden Mehrheit der Fälle bewahrt. Grammatik und Flüssigkeit können unvollkommen sein. Markenstimme wird nicht aufrechterhalten. Nuancierte Terminologie kann inkonsistent sein.
Risiko: Terminologiefehler, ungeschickte Formulierungen oder kulturell unangemessene Ausgaben können Endnutzer erreichen. Nur akzeptabel, wenn die Kosten dieser Fehler gering sind.
Leichtes Post-Editing (Stufe 2)
Was es ist: Ein menschlicher Editor überprüft MT-Ausgaben und nimmt minimale Korrekturen vor – offensichtliche Fehler beheben, Terminologie korrigieren und sicherstellen, dass die Übersetzung verständlich ist. Der Editor schreibt nicht für Stil oder Flüssigkeit um.
Wann zu verwenden:
- Produkt-UI-Strings, bei denen die MT-Ausgabe über Ihrem Konfidenzschwellenwert liegt (üblicherweise 75–85 auf einer QE-Skala von 0–100)
- Help-Center-Artikel und Wissensdatenbankinhalte
- E-Mail-Vorlagen und transaktionale Nachrichten
- Inhalte, bei denen Genauigkeit wichtig ist, aber literarische Qualität nicht
Qualitätserwartungen: Sachlich korrekt, terminologisch konsistent und grammatikalisch akzeptabel. Liest sich möglicherweise nicht so natürlich wie von einem Muttersprachler von Grund auf verfasste Inhalte.
Effizienzgewinn: Leichtes Post-Editing ist typischerweise 2–4 Mal schneller als das Übersetzen von Grund auf, gemäß Workflow-Benchmarks, die von Übersetzungsdienstleistern üblicherweise berichtet werden.
Vollständiges Post-Editing (Stufe 3)
Was es ist: Ein menschlicher Übersetzer überarbeitet MT-Ausgaben umfassend, um denselben Qualitätsstandard wie bei menschlicher Übersetzung zu erfüllen. Dies umfasst das Umschreiben für Flüssigkeit, das Anpassen von Ton und Stil, die Sicherstellung kultureller Angemessenheit und die Überprüfung der Terminologie.
Wann zu verwenden:
- Marketing-Texte, Landing Pages und markenbezogene Inhalte
- Rechtliche und regulatorische Inhalte
- Inhalte in Sprachpaaren, bei denen die MT-Qualität bekanntermaßen geringer ist (z. B. Englisch nach Japanisch, Englisch nach Arabisch)
- Alle Inhalte, bei denen die MT-Ausgabe unter Ihrem Konfidenzschwellenwert liegt
Qualitätserwartungen: Nicht von professioneller menschlicher Übersetzung zu unterscheiden. Liest sich natürlich, folgt den Markenstimmen-Richtlinien und ist kulturell für die Zielgruppe geeignet.
Effizienzgewinn: Vollständiges Post-Editing ist immer noch schneller als das Übersetzen von Grund auf – typischerweise 1,5–2 Mal schneller – weil die MT-Ausgabe einen strukturellen Ausgangspunkt bietet, selbst wenn erhebliches Umschreiben erforderlich ist.
Qualitätsschätzung: Wissen, wann MT gut genug ist
Qualitätsschätzung ist die Routing-Engine eines KI-Übersetzungsworkflows. Ohne sie bearbeiten Sie entweder zu viel (verschwenden menschliche Mühe bei bereits guter MT-Ausgabe) oder zu wenig (liefern schlechte Übersetzungen an Nutzer).
Wie QE-Modelle funktionieren
Moderne QE-Modelle werden typischerweise auf großen Datensätzen von MT-Ausgaben trainiert, die mit menschlichen Qualitätsurteilen gepaart sind. Sie lernen, Qualität aus Merkmalen wie diesen vorherzusagen:
- Quell-Ziel-Ausrichtung – deckt die Übersetzung alle Informationen aus der Quelle ab?
- Flüssigkeitssignale – liest sich die Übersetzung natürlich in der Zielsprache?
- Terminologiekonsistenz – werden domänenspezifische Begriffe korrekt und konsistent übersetzt?
Schwellenwertbasiertes Routing
Eine praktische QE-Implementierung definiert Schwellenwerte, die Ihren Qualitätsstufen entsprechen:
| QE-Bewertungsbereich | Routing-Entscheidung | Aktion |
|---|---|---|
| 85–100 | Stufe 1 (Rohe MT) | Automatisch genehmigen, zur Review-Warteschlange senden |
| 65–84 | Stufe 2 (Leichtes PE) | Zum Editor für schnelle Korrekturen weiterleiten |
| 0–64 | Stufe 3 (Vollständiges PE) | Zum Übersetzer für vollständige Überarbeitung weiterleiten |
Diese Schwellenwerte sollten pro Sprachpaar und Inhaltstyp kalibriert werden. Ein Schwellenwert, der für Englisch-Spanisch gut funktioniert, kann für Englisch-Chinesisch zu tolerant sein.
Praktische QE-Integration
Um QE in Ihren Workflow zu integrieren:
- Wählen Sie einen QE-Ansatz. Die Optionen reichen von Open-Source-Modellen (wie solchen, die über Frameworks wie OpenKiwi oder CometKiwi zugänglich sind) bis hin zu kommerziellen APIs großer Translation-Management-Plattformen.
- Legen Sie Basis-Schwellenwerte fest, indem Sie QE auf einer Stichprobe Ihrer MT-Ausgabe ausführen und die Bewertungen mit menschlichen Qualitätsurteilen vergleichen.
- Überwachen und anpassen. QE-Schwellenwerte sind keine einmalige Einstellung. Verfolgen Sie die Korrelation zwischen QE-Bewertungen und tatsächlichem Post-Editing-Aufwand im Laufe der Zeit und rekalibrieren Sie vierteljährlich.
Continuous Localization mit KI
Die größten Effizienzgewinne kommen nicht allein von schnellerer Übersetzung, sondern davon, Übersetzung in Ihren Entwicklungsworkflow zu integrieren, sodass sie kontinuierlich statt in Batches stattfindet.
Wie Continuous Localization aussieht
In einem traditionellen Workflow ist Lokalisierung eine Phase, die nach der Entwicklung stattfindet:
- Entwickler schreiben wochenlang oder monatelang Code
- Alle neuen Strings werden in einem Batch extrahiert
- Strings werden an Übersetzer gesendet
- Übersetzungen kommen Tage oder Wochen später zurück
- Übersetzungen werden integriert und getestet
- Fehler werden gefunden und zur Korrektur zurückgeschickt
In einem Continuous-Localization-Workflow findet Übersetzung parallel zur Entwicklung statt:
- Entwickler committet Code mit einem neuen String
- Der String wird automatisch extrahiert und an die Übersetzungspipeline gesendet
- MT erzeugt innerhalb von Minuten eine Erstübersetzung
- QE bewertet die Übersetzung und leitet sie entsprechend weiter
- Post-editierte Übersetzungen werden oft noch am selben Tag zurückcommittet
- Der lokalisierte Build wird in CI zusammen mit der Quellsprache getestet
CI/CD-Pipeline-Integration
Übersetzung in CI/CD zu integrieren bedeutet, Übersetzungsdateien genauso zu behandeln wie Code:
- Automatisierte Extraktion: Ein CI-Schritt erkennt neue oder geänderte Quell-Strings bei jedem Commit oder Pull Request.
- Übersetzungsauslöser: Neue Strings treten automatisch in die Übersetzungspipeline ein – keine manuelle Übergabe, keine Tabellenkalkulationen, keine E-Mail-Threads.
- Automatisierte Pull Requests: Abgeschlossene Übersetzungen werden als PRs mit Diff-Ansichten zurück an das Repository übermittelt, die genau zeigen, was sich geändert hat.
- Qualitäts-Gates: CI-Prüfungen können Merges blockieren, wenn die Übersetzungsabdeckung unter einen Schwellenwert fällt (z. B. „alle unterstützten Locales müssen Übersetzungen für mindestens 95 % der Strings haben").
Inkrementelle Übersetzungsstrategien
Continuous Localization funktioniert am besten mit inkrementeller Übersetzung – nur übersetzen, was sich geändert hat, anstatt ganze Dateien neu zu übersetzen:
- String-Level-Diffing: Vergleichen Sie die aktuelle Quelldatei mit der vorherigen Version und identifizieren Sie nur neue oder geänderte Strings. Senden Sie nur diese an die Übersetzungspipeline.
- Kontexterhaltung: Wenn ein Quell-String geändert wird, senden Sie die vorherige Übersetzung zusammen mit dem neuen Quelltext, damit Übersetzer sehen können, was sich geändert hat, und entsprechend aktualisieren können, anstatt von Grund auf zu übersetzen.
- Gestaffeltes Rollout: Bei großen Features, die Dutzende neuer Strings hinzufügen, können Übersetzungen inkrementell eingeführt werden – das Feature mit verfügbaren Übersetzungen liefern und verbleibende Sprachen in nachfolgenden Releases hinzufügen, wobei in der Zwischenzeit Fallback-Sprachen verwendet werden.
Wie better-i18n Übersetzungsworkflows automatisiert
better-i18n ist darauf ausgelegt, in den in diesem Artikel beschriebenen KI-gestützten Übersetzungsworkflow zu passen. Anstatt Ihre MT-Engine oder Ihre Übersetzer zu ersetzen, orchestriert es die Pipeline zwischen ihnen:
- Entwicklerfreundliches String-Management: Strings werden in einem strukturierten Format verwaltet, das Kontext, Variablen und Pluralisierungsregeln bewahrt. Entwickler pushen und pullen Übersetzungen über CLI oder CI-Integrationen.
- Übersetzungspipeline-Automatisierung: Neue Strings können automatisch zur maschinellen Übersetzung weitergeleitet werden, wobei abgeschlossene Übersetzungen mit Ihrer Codebasis synchronisiert werden. Der Workflow unterstützt inkrementelle Übersetzung – nur geänderte Strings werden verarbeitet.
- Integrierte Review-Workflows: Übersetzungsänderungen durchlaufen einen Review-und-Publish-Zyklus, sodass Teams Übersetzungen überprüfen können, bevor sie die Produktion erreichen. Ausstehende Änderungen sind in einem Dashboard sichtbar, und die Veröffentlichung kann hinter Genehmigungsschritten gesperrt werden.
- Framework-native Integration: SDKs für React, Next.js und andere Frameworks bedeuten, dass Übersetzungen mit Standard-i18n-Mustern geladen und gerendert werden. Keine benutzerdefinierte Verkabelung erforderlich.
Für einen Vergleich von KI-Übersetzungstools und wie better-i18n in die Landschaft passt, siehe unseren Leitfaden zu den besten KI-Übersetzungstools 2026. Wenn Sie evaluieren, ob Sie für Ihr Projekt KI-Übersetzung oder menschliche Übersetzung verwenden sollen, erläutert unser Beitrag zu automatischer Übersetzung vs. menschlicher Übersetzung den Entscheidungsrahmen.
FAQ
Was ist MTPE (Machine Translation Post-Editing)?
Machine Translation Post-Editing (MTPE) ist ein Workflow, bei dem maschinelle Übersetzung den ersten Entwurf erstellt und ein menschlicher Übersetzer die Ausgabe bearbeitet, um Qualitätsstandards zu erfüllen. MTPE kommt in zwei Formen: leichtes Post-Editing (nur Fehler beheben, die die Bedeutung beeinflussen) und vollständiges Post-Editing (Überarbeitung, um die Qualität menschlicher Übersetzung zu erreichen). MTPE wird in der Übersetzungsbranche weit verbreitet eingesetzt, weil es die Geschwindigkeit und Kosteneffizienz von MT mit der Qualitätssicherung menschlicher Überprüfung kombiniert.
Wie genau ist maschinelle Übersetzung im Jahr 2026?
Die Genauigkeit maschineller Übersetzung variiert erheblich nach Sprachpaar, Inhaltstyp und Fachgebiet. Bei eng verwandten europäischen Sprachen (Englisch-Spanisch, Englisch-Französisch, Englisch-Deutsch) erzeugen moderne neuronale MT-Engines Ausgaben, die für die meisten allgemeinen Inhalte nur leichte Bearbeitung erfordern. Bei strukturell unterschiedlichen Sprachpaaren (Englisch-Japanisch, Englisch-Arabisch, Englisch-Chinesisch) ist die MT-Qualität geringer und erfordert typischerweise umfangreicheres Post-Editing. Domänenspezifische Inhalte (Rechtliches, Medizinisches, Technisches) neigen ebenfalls zu geringerer MT-Genauigkeit, es sei denn, die Engine wurde auf relevanten Daten feinabgestimmt. Die wichtigste Erkenntnis: MT-Genauigkeit ist keine einzelne Zahl – sie hängt von Ihrem spezifischen Anwendungsfall ab, und Qualitätsschätzungstools helfen Ihnen, sie für Ihre Inhalte zu messen.
Wie richtet man Continuous Localization ein?
Das Einrichten von Continuous Localization umfasst drei Schritte. Erstens integrieren Sie String-Extraktion in Ihre Build- oder CI-Pipeline, sodass neue Strings automatisch erkannt werden, wenn Entwickler Code committen. Zweitens verbinden Sie den Extraktionsschritt mit einer Translation-Management-Plattform, die automatisierte MT- und Post-Editing-Workflows unterstützt. Drittens konfigurieren Sie automatisierte Auslieferung, sodass abgeschlossene Übersetzungen zurück in Ihre Codebasis übertragen werden – typischerweise über Pull Requests oder direkte Datei-Commits. Das Ziel ist die Eliminierung manueller Übergaben: Wenn ein Entwickler einen neuen String hinzufügt, nimmt die Übersetzungspipeline ihn automatisch auf, verarbeitet ihn durch MT und Post-Editing und liefert das Ergebnis zurück an das Repository, ohne dass jemand eine E-Mail sendet oder eine Tabellenkalkulation aktualisiert.