Translation Memory

 

 

TM-технология

 

Тranslation Мemory  - технология, при которой запоминаются уже сделанные один раз переводы, а при новых переводах автоматически заменяются переведенные фрагменты и термины соответствующими переводами.

Translation Memory (при техническом переводе документов, содержащих многократно повторяющиеся фрагменты):

  • предполагает первоначальное формирование терминологических баз и параллельных текстов,

  • позволяет (на основе базы переводов) без потери качества сократить время и силы, затрачиваемые на перевод,

  • обеспечивает (на основе базы переводов) терминологическое и стилистическое единство переводов.

 

TM-системы

 

Тranslation Мemory  - системы (программы), позволяющие переводчику накапливать в специальной базе данных (БД) парные двуязычные фрагменты теста (слова, словосочетания, предложения, абзацы) для повторного использования при переводе.

Основные функции ТМ-программы

  • сегментирование переводимого текста для поблочного перевода,

  • сличает полученных сочетаний с элементами БД (баз данных),

  • подстановка  готового перевода фрагмента в конечный текст (автоматическая или реализованная как предложение переводчику),

  • пополнение баз данных (параллельных текстов и глоссариев).

Дополнительные возможности:

  • “нечеткий” поиск.

  • ведение словарей терминов и непереводимых имен

  • поддержка языковых пар и “двунаправленных языков (текстовых массивов)”.

  • мультиязычный морфологический анализ

  • проверка орфографии для нескольких языков,

  • интеллектуальные средства сопоставления параллельных текстов с целью автоматического формирования парных фрагментов на двух языках.

  • интеграция с текстовыми процессорами и издательскими пакетами,

  • поддержка распространенных форматов (RTF, PDF, HTML.

  • группировка рабочих файлов, БД и терминологических словарей в отдельные "проекты".

 

 

Из истории...

 

В 1960-е годы Европейское объединение угля и стали (предшественник современного Евросоюза) стало создавать  данных под общим названием Eurodicautom.

В Советском Союзе для создания терминологических баз был создан ВИНИТИ (Всесоюзный институт научной и технической информации). 

 

 

 

TM-терминология

 

... "Напишите и переведите единожды –
 используйте сколько угодно раз" ...

Тranslation Мemory  - система управления базой данных (эталонных переводов).

Translation unit (сегмент, единица перевода) - одна запись (билингва) в такой базе данных соответствующая предложению, части сложносочинённого предложения, абзацу.

Exact match  (точное соответствие) - совпадение единицы перевода исходного текста с единицей перевода, хранящейся в базе, при которой она автоматически подставляется в перевод.

Fuzzy match (неточное соответствие) - неполное совпадение единицы перевода исходного текста с единицей перевода, хранящейся в базе, которая может быть подставлена в перевод после внесения переводчиком необходимых изменений.

Допустимая точность соответствия может настраиваться (в процентах совпадения).

Аlignment (выравнивание, сопоставление) - выявление в переводимом тексте фрагментов, переводы которых уже имеются в базе данных переводов.

 

Опытный письменный переводчик переводит в день без потери качества 7-8 стандартных страниц текста средней сложности. Он же, используя ТМ, при переводе похожего текста, может переводить до 12 страниц.

Maintenanceбслуживание) - упорядочение, редактирование и удаление сегментов в базах, исправление ошибок.

Terminology Program ерминологический словарь) - электронный словарь с поддержкой импорта, возможностью редактирования и пополнения статей.

Document Editorекстовый редактор) - двухоконная (для исходного текста и его перевода) среда осуществления процесса перевода с возможностью устанавливать в процентах степень сходства между переводимым в данный момент исходным текстом и текстом в копилке переводов.

Concordance онкорданс) - связка словоупотребления с контекстом.

Переводчику, работающему с  Translation Memory нужно перевести только новые фрагменты, которые еще не переводились. При этом качество перевода остается "человеческим", т.к. все переводы делал переводчик, а не компьютер.

 

 

 

Базы эталонных переводов

При обработке нового входящего документа Тranslation Мemory разбивает его на сегменты  и сравнивает их с уже хранящимися в базе данных эталонами.

 

TM эффективны лишь при высоком (от 75%) уровне совпадений

 

Успех применения TM напрямую зависит от объема и качества базы эталонных переводов по нужным тематикам и областям деятельности

Базы эталонных переводов можно купить, либо создать самостоятельно.

По этой причине этап внедрения TM требует существенных финансовых и трудозатрат, связанных с наполнением TM.

Практически каждая компания, как правило, имеет архив готовых документов на исходном и целевом языках, которые могут стать основой такой БД, но для них нужны специальная обработка и сегментация.

В любых переводческих агентствах, уже применяющих системы ТМ, всегда есть определенная доля заказов, которые в силу разных причин (нестандартный формат, перегруженный макет, особые требования переводчика, специализирующегося на данной узкой тематике) невозможно или нецелесообразно обрабатывать автоматически, что дает постоянный (пусть и не слишком значительный) источник новых материалов для добавления в БПТ, но заниматься этим вручную довольно дорого.

Автоматизировать все упомянутые процессы предназначен ABBYY Aligner.

 

 

 

 

ABBYY Aligner

 

ЗДЕСЬ

 

 

 

 

Области использования Тranslation Мemory

 

Очень часто (в новых версиях технической документации, программных продуктов, изменений в законодательстве) изменено всего 10-30% текста. Поэтому при использовании Тranslation Мemory не нужно будет переводить оставшиеся 70-90%.

 

Translation Memory неэффективен для перевода художественной литературы, журнальных и газетных статей, писем, каталогов, аннотаций, рефератов и т. п.

 

Translation Memory (в зависимости от характера перевода):

  • повышают эффективность на 20% - 80%;

  • экономят время от 30% до 70%;

  • экономят затраты от 30% до 80%

 

Translation Memory обеспечивают единообразие перевода терминологии в одинаковых фрагментах, что важно при техническом переводе и крайне необходимо переводе группой переводчиков.

Translation Memory, позволяет организовать работу коллектива переводчиков с гарантированным качеством перевода благодаря доступу к общей базе Translation Memory.

Translation Memory эффективен как инструмент для работы, которая:

  • выполняется на профессиональном уровне;

  • достаточно однородна по содержанию (есть часто повторяющиеся фрагменты или есть много очень похожих по содержанию документов);

  • имеет большой объем (необходимо разделить работу между несколькими переводчиками или нужно сократить срок перевода);

  • часто модифицируется, и новые версии этой документации мало отличаются от старых;

  • требует параллельных многоязычных переводов;

  • требует наличия готовых переводов практически одновременно с окончанием подготовки оригинала;

  • требует высокого качества перевода.

 

С другой стороны, если переводчик регулярно подставляет в свой перевод точные соответствия, извлеченные из баз переводов, без контроля их использования в новом контексте, качество переведенного текста может ухудшиться.

 

 

 

 

Востребованность Тranslation Мemory

 

Более 75% переводчиков в мире пользуется TM-инструментарием.

Средства, потраченные на создание базы переводов, рассматриваются не как затраты, а, скорее, как инвестиции в стабильную и качественную работу, что увеличивает не только прибыль, но и стоимость самой компании.

По данным исследовательского агентства IDC, на мировом рынке систем перевода 70% приходится на системы Translation Memory, остальное - на системы машинного перевода.

09.11.2010

Гильдия профессиональных переводчиков (ведущая белорусская компания на рынке переводческих услуг) приобрела и внедряет последнюю версию SDL Trados в целях автоматизации процесса перевода больших объемов документации и повышения производительности труда на базе решений Translation Memory.

Татьяна Мытько (начальник отдела по работе с корпоративными клиентами БГП): Внедрение технологий ТМ и программных продуктов SDL Trados позволит нашей компании соответствовать растущим требованиям клиентов к уровню сервиса, снизить издержки, унифицировать и автоматизировать аутсорсинговые процессы.

Дмитрий Калачик (начальник службы переводов): Автоматизация для современного переводческого бизнеса имеет ключевое значение, позволяя выполнять постоянно растущие объемы работ качественно, в срок и за разумную цену.

 

 

 

 

Стандарты Тranslation Мemory

 

TBX

Termbase Exchange format

Обмен терминологическими базами

Позволяет проводить обмен терминологией, в том числе детальной лексической информацией;

Обеспечивает реестр четко определенных «категорий данных» со стандартизованными именами, которые функционируют как типы элементов данных или предопределенные значения;

Предоставляет основу для каркасной структуры  и включает структурную метамодель для терминологических языков разметки (Terminology Markup Languages) в целом.

GMX GILT

Globalization, Internationalization, Localization, and Translation

Глобализация, интернационализация, локализация, перевод

Состоит из трех частей: GMX-V для показателей объема, GMX-C для показателей сложности, GMX-Q для показателей качества. Направлен на квантификацию объема работ и требований качества при реализации задач GILT.

OLIF

Open Lexicon Interchange Format

Открытый формат обмена лексиконом

Открытый, совместимый с XML формат, используется для обмена терминологическими и лексическими данными.

XLIFF

XML Localisation Interchange File Format

XML формат для взаимного обмена при локализации

Создан как единый формат файлов для взаимного обмена, который распознается всеми провайдерами локализации.

XLIFF — это наилучший в современной индустрии переводов способ обмена информацией в формате XML/

Используя XLIFF, можно защитить синтаксис исходного документа от случайной порчи в процессе перевода, записать переводческую память или предпочтительную терминологию, создавать  динамические web-страницы для перевода и получив доступ к ним через браузер проводить весь процесс перевода онлайн.

TransWS

Translation Web Services — Веб сервисы для перевода

Определяет требуемые вызовы для использования веб-сервисов при отправлении и получении файлов и сообщений, имеющих отношение к проектам локализации

Задумывался как развернутая система автоматизации процесса локализации с использованием сервисов Интернета

Большинство систем Translation Memory как минимум поддерживают создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов (alignment), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.

 

 

 

 

Translation Memory eXchange format

 

В разных системах ТМ используются разные форматы хранения данных:

  • текстовый формат *.txt в Wordfast (реализована как набор макросов для MS Word);

  • база данных Access в Deja Vu и т.д.

TMX (Translation Memory eXchange format, формат обмена памятью переводов) - основанный на XML международный формат, который может генерироваться практически всеми системами Translation Memory.

Последняя версия TMX - 1.4b позволяет восстанавливать исходные документы и их перевод из файла TMX.

Благодаря этому сделанные переводы можно использовать в разных приложениях, то есть переводчик работающий с OmegaT может использовать Translation Memory, созданную TRADOS в  и наоборот.

SRX - XML-формат созданный для улучшения TMX и большей эффективности обмена памятью переводов между програмами. SRX позволяет указывать правила сегментации, которые использовались в предыдущем переводе, повышает эффективность отождествления сегментов в текущем тексте с содержимым Translation Memory.

 

 

 

 

 

Pазработчики Translation Memory и их системы

 

Компания

Название продукта

Языковые пары

SDL TRADOS (Великобритания, Германия)
www.sdl.com/en/ products/products-index/sdl-trados/

SDL Trados Studio Freelance
SDL Trados Studio  Professional
SDL Trados Studio  Elite
SDL Trados Studio  Lite

все европейские языки, русский, японский, китайский, корейский, иврит, арабский (всего 150 языков)

ATRIL (США)

www.atril.com/

Deja Vu

все языки, поддерживаемые Windows

Kilgray (Венгрия)

www.kilgray.com

memoQ

все языки с латинским и кириллическим алфавитом и др..

STAR (Швейцария)
www.star-group.net/star-www/home/all/star-group/eng/star.html

Transit (Translation Memory)
TermStar
WebTerm

поддержка более 40 языков

ESTeam AB (Греция)

www.esteam.gr/

ESTeam Translator
продукт, интегрирующий технологии Translation Memory (TM) и Machine Translation (MT)

европейские языки

XPLANATION (Италия)

www.xplanation.com

Tstream
решение, интегрирующее технологии Translation Memory (TM) и Machine Translation (MT)

с 6 языков (англ, нем, фр, исп, итал, голландск) на более 10 других языков (англ, нем, фр, исп, итал, голландск, датский, норвежский, финский, шведский и португальский)

 

 

 

 

 

PROMT FOR TRADOS и PROMT TerM

 

PROMT Expert включает модули, специально разработанные для реализации интегрированной технологии PROMT-TRADOS: PROMT Term и PROMT For TRADOS (P4T).

PROMT For TRADOS предназначена для интеграции системы машинного перевода PROMT и системы ТM TRADOS:

  • перевод в системе TRADOS;

  • перевод в системе PROMT не найденных в ТМ сегментов;

  • вставка переведенных PROMT сегментов в TM.

Применение интегрированной технологии делает процесс перевода больших массивов документации управляемым и повышает его экономическую эффективность.

 

PROMT TerM предназначен для автоматического извлечения и управления терминологией:

  • подсчет частотности слов и словосочетаний в анализируемых документах;

  • составление терминологических списков;

  • управление терминологией: возможность установки фильтров и условий обработки, работа с системами PROMT и TRADOS.

Основные этапы работы с PROMT TerM:

  • Выбор файлов для анализа.

  • Настройка системы. 

  • Поиск перевода в словарях системы PROMT как пользовательских, так и специализированных.

  • Выбор параметров для формирования словосочетаний.

  • Совместное использование систем МТ и ТМ.

  • Взаимодействие PROMT TerM с системами МT и ТМ.

  • Постредактирование.

 

 

 

 

 

Translation Memory в PROMT 9.0 Professional

 

 

 

 

 

SDL International

 

Trados SDL (http://www.sdl.com) - мировой лидер в создании систем Translation Memory.

1984 - в Штуттгарте (Германия) основана компания Trados GmbH.

1997 - 20 % акций компании были приобретены Microsoft.

2002 - Trados объединилась с Uniscape Inc., и получила название Trados Inc. со штаб-квартирой в Александрии, Вирджиния (США).

2005 - Trados Inc. приобретена британской SDL International.

От 50% до 75% мирового рынка Translation Memory.

Число сотрудников более 5000. Представительства в 38 странах.

Более 85 000 профессиональных переводчиков во всем мире используют системы Translation Memory компании Trados.

 

 

 

 

SDL Trados Studio

 

 

SDL Trados  – мировой стандарт Translation Memory, самая популярная система от компании SDL, поддердивает Windows Vista и Microsoft Office 2007.

Система SDLTrados состоит из модулей, предназначенных для перевода текстов различного формата и ведения терминологических баз данных:

  • Translator’s Workbench — модуль работы с базами данных памяти переводов TM (создания, обслуживания, импорта, экспорта). Создание документов перевода и их редактирование производятся в отдельных модулях.

  • Панель Trados в Microsoft Word — модуль для перевода документов в Microsoft Word.

  • TagEditor — модуль для перевода документов в формате PowerPoint, Excel, HTML, XML и т. п.

  • WinAlign — модуль для создания памяти переводов на основе ранее переведённых двуязычных текстов.

  • S-Tagger — модуль для перевода документов в формате FrameMaker и InterLeaf.

  • T-Window — модуль для перевода текста из буфера обмена.

  • MultiTerm — модуль для ведения глоссариев.

  • ExtraTerm — модуль для автоматического поиска терминологических кандидатов в тексте и создания глоссариев на их основе. 

30.04.2009 - Вышла SDLTradosStudio 2009 -  результат четырехлетней разработки стоимостью свыше $200 000 000. SDL Trados 2009 имеет новый интерфейс и платформу Translation Memory на основе XML. SDL Trados Studio 2009 Professional - $2200. SDL Trados Studio 2009 Freelance - $500.

27.09.2011 Вышла SDLTradosStudio 2011 с интеграцией систем машинного перевода ((Language Weaver, SDL BeGlobal, Google Translate, Microsoft Bing) и последующего редактирования

09.09.2013 Вышла SDLTradosStudio 2014 c расширенными функциями  систем машинного перевода через открытый API плагины SDL OpenExchange в SDL OpenExchange

см. Англо-русский терминологический Trados-словарь: http://multiterm.tra-service.ru/

 

 

 

 

 

 

 

 

Déjà Vu

 

18.02.2014 Вышла Déjà Vu X3

 Популярная у переводчиков-фрилансеров Déjà Vu:

  • Функция DeepMiner – сложный перекрестный анализ позволяет «извлекать» переводы отдельных слов и фраз, «встроенных» в сегмент, позволяет также исправлять нечеткие соответствия, создавая новые законченные переводы.

  • Функция AutoWrite предложит завершить набираемое слово/фрагмент. При работе AutoWrite использует как базы данных, так и функцию DeepMiner, позволяя обеспечить существенно большую производительность, чем у любого другого аналога.

  • «Автоподстановка» перевода по всем аналогичным сегментам на проекте,

  • «Автосборка» перевода из фрагментов, хранящихся в базах данных, функции машинного перевода Google Translate.

  • Функция Лексикона для создания глоссариев на основе переводимых проектов, определения частотности употребления терминов  для контроля качества.

  • «Автопостроение» Лексикона значительно сокращает время на его создание.

  • Функции контроля качества проверят соответствие чисел, дат, номеров разделов и других числовых значений,

  • Язык структурированных запросов SQL Select и SQL Execute для управления качеством на крупных проектах и больших базах данных.

Возможность создания и редактирования шаблонов проектов снижает время за создание проектов, загрузку файлов и баз данных и др.

 

 

 

 

Простые решения Translation Memory

 

Бюджетные и бесплатные программы Translation Memory доступны и вполне работоспособны, хоть и не так функциональны и удобны как пакеты типа Trados.

 

Wordfast

www.wordfast.net

90 евро

Wordfast  - программа умещается в один компактный шаблон, который следует поместить в папку автозагрузки MS Word. Сегментирует текст по предложениям. Для баз памяти перевода Wordfast использует текстовые файлы (txt) и способен импортировать и экспортировать стандартный формат TMX.

Русскоязычное сообщество любителей Wordfast: groups.yahoo.com/group/Wordfast-RU.

Тема

tema-tm.ru

бесплатно

Разработка российской компании "Тема Девелопмент"  работает по тому же принципу, что и Wordfast, то есть встраивается в Word версий 2000 и 2003.

Файл памяти перевода "Темы" имеет расширение dat, и его можно импортировать и экспортировать, используя текстовый формат.

  OmegaT

www.omegat.org

бесплатно

Лицензия: GPL

Самостоятельное приложение со своим интерфейсом (требует Java 2 Runtime Environment, которое можно скачать с java.sun.com).

Поддерживает форматы txt, html и sxw (формат OpenOffice).

Сегментирует переводимый текст по абзацамс помощью макросов  для OpenOffice.org. Файлы памяти переводов OmegaT, соответствуют формату TMX.

LF Aligner

бесплатно

здесь

Инструмент для выравнивания параллельных текстов. OpenSource альтернатива ABBYY Aligner. Работает с txt, rtf, doc/docx (всё в в UTF-8), pdf.
Для корректной работы LF Aligner необходимо использовать только латиницу в названиях каталогов и файлов.
Просмотр и правка сегментированного текста, в встроенном редакторе или Excel.

 

 

kmp