翻訳メモリ

目次

OmegaT と TMX ファイル

TMX ファイルの位置と目的

OmegaT は 三箇所の別々の場所にある TMX ファイルを使います。

TMX ファイルと言語

TMX ファイルは、異なった言語に対して等価な分節からなる翻訳単位を含みます。翻訳単位は少なくとも二つのtranslation unit variation (tuv)で構成されます。どちらも原文にも訳文にもなります。

プロジェクトの設定により、どちらが原文言語でどちらが訳文言語かを指定します。したがって、OmegaT はプロジェクトの原文言語に対応するtuvを取って原文分節として使い、プロジェクトの訳文言語に対応するtuvを取ってその分節を目標の分節として使います。

言語コードには様々な形式があります。OmegaT は現在のところ以下の形のもののみを認識します:

または

プロジェクトの言語コードと TMX の言語コードが完全に一致した場合、分節はメモリに読み込まれます。言語コードのみが一致して国コードは一致しなかった場合も、分節はメモリに読み込まれます。言語コードと国コードのどちらも一致しなかった場合、分節はメモリに読み込まれません。

OmegaT で行なった翻訳のメモリを保存する

project_save.tmx ファイルにはプロジェクトを開始してからの 全ての 分節が記憶されています。たとえばプロジェクトの分節に変更を加えると、project_save.tmx は新しい翻訳の組を記録しますが、以前の全ての情報も残されます。これは参考訳文ウィンドウで オーファン文字列と表示されます。このようなマッチングは、既に存在はしないけれども修正される前に記録された分節を参照しています。修正を間違えたときは、以前の設定に戻せば古い記録が復活します。

他の翻訳ツールで作成されたメモリを使う

ファイルのインポート

OmegaT は TMX バージョン 1.1-1.4b (レベル 1 と レベル 2 の両方)のインポートに対応しています。これにより、他のツールで作成した翻訳メモリを OmegaT に読み込ませることができます。

しかし、OmegaT は 完全にはレベル2 TMX ファイル(翻訳だけでなくフォーマットも含むもの)に対応していないので、参考訳文検索の精度は、レベル 2 TMX ファイルを読み込んだときには少し落ちます。

インポートしたファイルの扱い

OmegaT は翻訳メモリファイル(TMX ファイル)を扱う場合、非常に厳密な手続きに従います。

このファイルになんらかの問題があれば、OmegaT は単純にそれを読み込みません。

ツールの中には場合によっては不正な TMX ファイルを生成することが知られています。もしそのようなファイルを OmegaT で参考訳文として使いたい場合、OmegaT が拒否した部分を修正する必要があります。修正は単純な操作で、OmegaT は関係するエラーメッセージで指示を与えます。もし手に負えないと感じたなら、ユーザーグループで助言を求めることもできます。

OmegaT の翻訳メモリを他の翻訳ツールで使う

OmegaT は TMX ファイルバージョン 1.4 (レベル 1 と 2 の両方)をエクスポートします。レベル 2 エクスポートは 標準 レベル 2 ではありませんが、TMX レベル 2 に対応した翻訳ツールで正しいマッチングを生成するのに十分です。

文章情報のみが必要(フォーマット情報は不要)の場合は、OmegaT が作成したレベル 1 ファイルを使って下さい。

翻訳メモリのアップグレード

以前のバージョンの OmegaT は段落単位でしか原文を分節化できず、HTML と Open Document ファイルで一貫性のない番号を付けたフォーマットタグがありました。OmegaT 1.6.2 は、参考訳文の品質を向上し、既にある翻訳をよりよく使うために、このような TMX をその場で検出してアップグレードします -- これにより、やり直す必要がなくなります。

プロジェクトのTMXは1度だけアップグレードされ、アップグレードされた形式で書き込まれ、古いTMXファイルはプロジェクトが読み込まれる度にその場でアップグレードされます。OmegaT 1.6.2 においてファイルフィルタに変更が加えられたため、分節が全く違うものになってしまい、翻訳メモリを手動でアップグレードする必要があることが稀にあることに注意してください。


特記事項