Mało kto zastanawiał się nad tym, jaką ewolucję przeszły tłumaczenia wspomagane komputerowo dzięki hipertekstowym językom programowania. Dziś podstawą formatu plików translatorskich jest XML. Jest to język znacznikowy, którego ojcem był HTML, znany z projektowania stron internetowych.
W oparciu o standard XML powstał najpopularniejszy format bazy translatorskiej, czyli TMX. Plik TMX jest, jak wszystkie pliki z rodziny XML, zwykłym plikiem tekstowym zbudowanym z zagnieżdżonych w nim tagów. Mają one specjalną nazwę, której struktura ułatwia identyfikację poszczególnych bitów danych.
<tuv xml:lang=”PL-PL”>
<seg> Postanowienia ogólne </ seg>
</ TUV>
<tuv xml:lang=”ES-ES”>
<seg> Disposiciones Generalne </ seg>
</ TUV>
Powyższy fragment pokazuje segment „Przepisy ogólne” i jego hiszpański odpowiednik. Pojedynczy segment zawiera komplet znaczników języka XML.
Format TMX jest dziś obsługiwany przez większość programów CAT. Daje to możliwość przyrostowego zapisywania kolejnych rekordów bazy niezależnie od używanego do danego tłumaczenia programu.
Tym sposobem zamknęło się pewne koło. Dzięki HTML powstał XML będący podstawą baz TMX, które usprawniają z kolei między innymi lokalizację stron internetowych.
PK