エンジニアリング//14 読了時間

翻訳メモリとAI:TMシステムが最新のMTと連携する仕組み

Eray Gündoğmuş
共有

翻訳メモリとAI:TMシステムが最新のMTと連携する仕組み

重要なポイント

  • 翻訳メモリはソース・ターゲットのセグメントペアを再利用のために保存し、翻訳コストを削減し、一貫性を確保する
  • 最新のTMSプラットフォームは、翻訳ワークフローを最適化するためにTMマッチと機械翻訳を組み合わせる
  • TMの品質は、一貫した用語管理、適切なセグメンテーション、定期的なメンテナンスに依存する
  • TM + MT + 人間によるレビューの組み合わせが、ほとんどのプロジェクトで最良のコスト品質バランスを実現する

翻訳メモリとは?

翻訳メモリ(TM)は、以前に翻訳したテキストセグメント(通常は文やフレーズ)をソース・ターゲットペアとして保存するデータベースです。翻訳者がすでに保存されているセグメントと類似したセグメントを見つけた場合、TMは以前の翻訳を提案します。

マッチの種類:

マッチの種類定義
100%マッチ同一のセグメントがすでに翻訳済み"Save changes" → "Änderungen speichern"
ファジーマッチ(70〜99%)類似しているが同一ではないセグメント"Save all changes"("Save changes"が存在する場合)
マッチなし(0%)TMに類似セグメントなし完全に新しいコンテンツ
コンテキストマッチ(101%)周囲のコンテキストが一致する100%マッチドキュメント内の同じ位置にある同一セグメント

TMがコストを削減する仕組み

TMシステムは、以前に翻訳されたコンテンツを再利用することで翻訳コストを削減します:

  • 100%マッチ はレビューが最小限で済む — 大幅な時間節約
  • ファジーマッチ は翻訳者が編集できる出発点を提供する — ゼロから翻訳するより速い
  • 一貫性 — 同じ用語がすべてのコンテンツで常に同じ方法で翻訳される
  • ボリュームディスカウント — ほとんどの翻訳ベンダーがTMマッチに低い料金を設定している

TM + 機械翻訳の統合

最新の翻訳ワークフローはTMとMTを組み合わせます:

  1. 最初にTMルックアップ — 100%マッチと高いファジーマッチを確認
  2. マッチなしセグメントにMT — NMTを使用して初期翻訳を生成
  3. 人間によるレビュー — 翻訳者がTMとMT両方の提案をポストエディット
  4. TMの更新 — 承認された翻訳が将来の再利用のためにTMに保存される

このパイプラインは以下の最良のバランスを実現します:

  • スピード — MTが新しいコンテンツを即座に処理
  • 一貫性 — TMが用語とスタイルの一貫性を確保
  • 品質 — 人間によるレビューがTMとMTの出力のエラーを検出
  • コスト — 人間の翻訳作業をレビューと編集に絞る

翻訳メモリの構築とメンテナンス

TMの構築

  • 既存の翻訳から始める — 以前に翻訳されたコンテンツをインポートする
  • 並行文書を整合させる — 整合ツールを使って翻訳済み文書からTMエントリを作成する
  • 時間をかけて蓄積する — すべての翻訳プロジェクトがTMに追加される
  • TMをドメイン別に分ける — 技術文書のTMはマーケティングのTMと混在させない

TMの品質管理

  • 定期的なクリーンアップ — 古いまたは誤ったエントリを削除する
  • 用語の一貫性 — 主要な用語が常に同じ方法で翻訳されていることを確認する
  • コンテキストメタデータ — より良いマッチングのためにエントリにプロジェクト、ドメイン、日付をタグ付けする
  • バージョン管理 — 時間の経過とともにTMエントリへの変更を追跡する
  • 重複排除 — 不一致を引き起こす可能性がある重複エントリを削除する

TMファイルフォーマット

フォーマット説明ユースケース
TMX (Translation Memory eXchange)XMLベースの業界標準システム間のTM交換
XLIFF (XML Localization Interchange Format)翻訳ファイルの標準ファイルベースの翻訳ワークフロー
TBX (TermBase eXchange)用語データベースの標準用語集と用語管理
CSV/TSVシンプルな表形式基本的なTMのインポート/エクスポート

よくある質問

翻訳メモリはどれくらいの大きさにすべきですか? TMのサイズはプロジェクトを重ねるごとに自然と大きくなります。最小サイズの要件はありません。数百のエントリを持つ小さなTMでも、一貫性を通じて価値を提供します。大きなTM(数百万のセグメント)は、有用であり続けるためには適切なメンテナンスが必要です。

TMは1つにすべきですか、複数にすべきですか? 異なるコンテンツタイプ(マーケティング、技術文書、法務)には別々のTMを使用してください。これにより、不適切なマッチ(例:法務文書にマーケティングのトーンが現れる)を防ぎます。ほとんどのTMSプラットフォームは、優先度ランキング付きで複数のTMをサポートしています。

TMは機械翻訳と連携しますか? はい。最新のTMSプラットフォームはまずTMマッチを使用し(一貫性を優先)、TMで見つからないセグメントにはMTにフォールバックします。翻訳者はその後すべての出力をレビューして承認し、承認された翻訳はTMに追加されます。

TMの有効性をどのように測定しますか? 以下を追跡してください:レバレッジ率(TMマッチでカバーされるコンテンツの割合)、プロジェクトあたりのコスト削減、翻訳者あたりの時間節約、翻訳コンテンツ全体の一貫性メトリクス。

TMをプロジェクト間で共有できますか? はい、慎重な管理のもとで可能です。共有TMには承認済みの高品質な翻訳のみが含まれていることを確認してください。TMメタデータ(プロジェクトタグ、ドメイン)を使用して、適切にマッチをフィルタリングしてください。

Comments

Loading comments...