Translation Memory
12.11.2009
ABBYY представила
ABBYY Aligner
(http://www.abbyy.ru/aligner)
- новую
профессиональную программу для выравнивания параллельных текстов
на различных языках и создания баз Translation Memory (TM).
ABBYY Aligner обладает высоким качеством выравнивания параллельных текстов на различных языках, простым и удобным интерфейсом и функциональными возможностями для быстрой и эффективной работы.
В большинстве подобных программ применяются методы автоматического
выравнивания по порядку предложений в тексте, что приводит к возникновению
большого числа ошибок.
ABBYY
Aligner
на основе семантического алгоритма сравнивает сегменты исходного текста с
сегментами переведенного текста, проверяя их на смысловое сходство.
|
Зачем это нужно?
Иван
Смольников
(генеральный директор компании ABBYY Language Services/«Переведем.ру»):
При заказе новых переводов все больше и больше наших клиентов предпочитают,
чтобы мы использовали их собственные переведенные материалы в виде баз
Translation Memory. Это позволяет нашим переводчикам экономить время и усилия,
что приводит к снижению стоимости переводческих услуг и сроков выполнения
заказов.
ABBYY
Aligner:
-
работает
с 90 направлениями перевода (10 языков),
-
имеет пакетный режим обработки
большого объема документов,
-
открывает документы в различных популярных форматах,
-
сохраняет результат в формате Translation Memory (стандарт TMX 1.4b)
или RTF.
|
Принципы работы
ABBYY Aligner
1. Выравнивание параллельных текстов при помощи ABBYY Aligner
В процессе обработки текстов ABBYY Aligner в соответствии со своими внутренними алгоритмами разбивает исходный текст и текст с переводом на фрагменты (эти фрагменты также часто называют сегментами), которые затем сопоставляются друг другу, то есть выравниваются. В результате получается документ (выровненный текст), состоящий из cтрок, каждая из которых состоит из фрагмента исходного текста и сопоставленного ему фрагмента текста перевода.
2. Редактирование текстов
Полученный результат можно редактировать: разбивать или объединять фрагменты и cтроки, перемещать фрагменты по тексту, сопоставлять их вручную или редактировать исходный или переведенный тексты.
3. Сохранение результата
Текущий проект можно сохранить во внутреннем формате программы (*.ata), чтобы возобновить редактирование позже.
4. Экспорт результата
После того, как все необходимые правки были сделаны, результат можно экспортировать во внешние форматы (*.tmx или *.rtf). |
Глоссарий
ABBYY Aligner
CAT
(Computer-assisted translation, computer-aided translation) -
программное обеспечение, использующееся для выполнения переводов.
TMX
(Translation Memory eXchange — Обмен памятью переводов) — открытый
формат файлов XML, который служит для обмена данными баз памяти
переводов (баз ТМ). Базы ТМ создаются в процессе автоматизированного
перевода при использовании CAT-средств.
База Translation Memory
(база TM) – база данных, содержащая ранее переведенные тексты. Одна
запись в базе TM соответствует сегменту исходного текста и сегменту
переведенного текста. Сегмент обычно состоит из предложения, а иногда
части сложного предложения или абзаца.
Выравнивание
– сопоставление исходного и переведенного текстов по предложениям,
абзацам или другим элементам, завершенным по смыслу, для сохранения
результата в базу Translation Memory.
Двуязычный файл
- файл, содержащий результаты выравнивания, который может иметь
расширения: *.ata, *.rtf, *.tmx.
Пакет
- множество параллельных текстов с одним направлением перевода. Пакет
формируется при пакетном выравнивании в приложении
ABBYY Aligner Batch
Processing.
Параллельные тексты
– текст на одном языке и его перевод на другой язык.
Проект
- двуязычный файл с расширением *.ata, содержащий текст на одном языке
вместе с его переводом на другой.
Сегмент
- часть исходного или переведенного текста, содержащая одно или
несколько слов или предложений, связанных между собой и завершенных по
смыслу.
Серийный номер
— это уникальный номер, который выдается вам при покупке/получении
программы. Серийный номер необходим для активации программы.
Столбец
- поле в проекте, содержащее исходный или переведенный документ.
Строка
- два сегмента с одним порядковым номером, один из которых содержит
слово или несколько слов или предложений, связанных между собой и
завершенных по смыслу, а другой - их перевод на другой язык.
Текстовый слой
- область PDF-файла, содержащая (полностью или частично) находящийся в
документе текст. Присутствует не во всех PDF-файлах.
|
ABBYY
Aligner
Online
ABBYY
Aligner Online
- web-сервис для выравнивания небольших параллельных текстов.
БЫЛ доступен по адресу: www.aligner.abbyyonline.ru.
|
ABBYY
Aligner
Параметр |
Форматы обрабатываемых файлов |
Можно также скопировать текст из другого приложения и
вставить в окно ABBYY Aligner |
Языки обрабатываемых документов |
-
Английский
-
Немецкий
-
Французский
-
Испанский
-
Итальянский
-
Польский
-
Португальский
-
Турецкий
-
Украинский
-
Русский
|
Максимальный объем загружаемых файлов |
10
Мб |
Редактирование результата |
Редактор, позволяющий обрабатывать полученный результат:
-
возможность разбивать или объединять полученные
сегменты текста, или перемещать их вверх/вниз по
тексту
-
простой способ быстро исправить неправильно
сопоставленные сегменты
-
редактирование текста прямо в окне выравнивания
|
Подсвечивание ошибок |
Подсвечивание возможных ошибок при выравнивании
позволяет быстро проверить полученный вариант и не
пропустить возможную ошибку. Выделяются такие ошибки
как:
|
Пакетное выравнивание |
Поддержана загрузка пакета документов для
автоматического выравнивания большого объема документов. |
Форматы файлов для сохранения результата (экспорта) |
TMX,
RTF, внутренний формат программы ATA |
|