ABBYY Aligner

 

 

 

Translation Memory

 

ЗДЕСЬ

 

 

 

12.11.2009 ABBYY представила ABBYY Aligner (http://www.abbyy.ru/aligner) - новую профессиональную программу для выравнивания параллельных текстов на различных языках и создания баз Translation Memory (TM).

ABBYY Aligner обладает высоким качеством выравнивания параллельных текстов на различных языках, простым и удобным интерфейсом и функциональными возможностями для быстрой и эффективной работы.

В большинстве подобных программ применяются методы автоматического выравнивания по порядку предложений в тексте, что приводит к возникновению большого числа ошибок.

ABBYY Aligner на основе семантического алгоритма сравнивает сегменты исходного текста с сегментами переведенного текста, проверяя их на смысловое сходство.

 

 

 

 

Зачем это нужно?

 

Иван Смольников (генеральный директор компании ABBYY Language Services/«Переведем.ру»):

При заказе новых переводов все больше и больше наших клиентов предпочитают, чтобы мы использовали их собственные переведенные материалы в виде баз Translation Memory. Это позволяет нашим переводчикам экономить время и усилия, что приводит к снижению стоимости переводческих услуг и сроков выполнения заказов.

ABBYY Aligner:

  • работает с 90 направлениями перевода (10 языков),

  • имеет пакетный режим обработки большого объема документов,

  • открывает документы в различных популярных форматах,

  • сохраняет результат в формате Translation Memory (стандарт TMX 1.4b) или RTF.

 

 

 

Принципы работы ABBYY Aligner

 

1. Выравнивание параллельных текстов при помощи ABBYY Aligner

В процессе обработки текстов ABBYY Aligner в соответствии со своими внутренними алгоритмами разбивает исходный текст и текст с переводом на фрагменты (эти фрагменты также часто называют сегментами), которые затем сопоставляются друг другу, то есть выравниваются. В результате получается документ (выровненный текст), состоящий из cтрок, каждая из которых состоит из фрагмента исходного текста и сопоставленного ему фрагмента текста перевода.

 

 

2. Редактирование текстов

Полученный результат можно редактировать: разбивать или объединять фрагменты и cтроки, перемещать фрагменты по тексту, сопоставлять их вручную или редактировать исходный или переведенный тексты.

3. Сохранение результата

Текущий проект можно сохранить во внутреннем формате программы (*.ata), чтобы возобновить редактирование позже.

4. Экспорт результата

После того, как все необходимые правки были сделаны, результат можно экспортировать во внешние форматы (*.tmx или *.rtf).

 

 

 

 

Глоссарий ABBYY Aligner

 

CAT (Computer-assisted translation, computer-aided translation) - программное обеспечение, использующееся для выполнения переводов.

TMX (Translation Memory eXchange — Обмен памятью переводов) — открытый формат файлов XML, который служит для обмена данными баз памяти переводов (баз ТМ). Базы ТМ создаются в процессе автоматизированного перевода при использовании CAT-средств.

База Translation Memory (база TM) – база данных, содержащая ранее переведенные тексты. Одна запись в базе TM соответствует сегменту исходного текста и сегменту переведенного текста. Сегмент обычно состоит из предложения, а иногда части сложного предложения или абзаца.

Выравнивание – сопоставление исходного и переведенного текстов по предложениям, абзацам или другим элементам, завершенным по смыслу, для сохранения результата в базу Translation Memory.

Двуязычный файл - файл, содержащий результаты выравнивания, который может иметь расширения: *.ata, *.rtf, *.tmx.

Пакет - множество параллельных текстов с одним направлением перевода. Пакет формируется при пакетном выравнивании в приложении ABBYY Aligner Batch Processing.

Параллельные тексты – текст на одном языке и его перевод на другой язык.

Проект - двуязычный файл с расширением *.ata, содержащий текст на одном языке вместе с его переводом на другой.

Сегмент - часть исходного или переведенного текста, содержащая одно или несколько слов или предложений, связанных между собой и завершенных по смыслу.

 

Серийный номер — это уникальный номер, который выдается вам при покупке/получении программы. Серийный номер необходим для активации программы.

Столбец - поле в проекте, содержащее исходный или переведенный документ.

Строка - два сегмента с одним порядковым номером, один из которых содержит слово или несколько слов или предложений, связанных между собой и завершенных по смыслу, а другой - их перевод на другой язык.

Текстовый слой - область PDF-файла, содержащая (полностью или частично) находящийся в документе текст. Присутствует не во всех PDF-файлах.

 

 

 

 

ABBYY Aligner Online

 

ABBYY Aligner Online - web-сервис для выравнивания небольших параллельных текстов.

БЫЛ доступен по адресу: www.aligner.abbyyonline.ru.

 

 

 

ABBYY Aligner

 

Параметр ABBYY Aligner

Форматы обрабатываемых файлов

  • DOC, DOCX, TXT, RTF

  • PDF

  • HTML

  • PPT, PPTX, PPS, PPSX

  • XLS, XLSX

  • XML (Word/PowerPoint ® 2007)

Можно также скопировать текст из другого приложения и вставить в окно ABBYY Aligner

Языки обрабатываемых документов

  • Английский

  • Немецкий

  • Французский

  • Испанский

  • Итальянский

  • Польский

  • Португальский

  • Турецкий

  • Украинский

  • Русский

Максимальный объем загружаемых файлов

10 Мб

Редактирование результата

Редактор, позволяющий обрабатывать полученный результат:

  • возможность разбивать или объединять полученные сегменты текста, или перемещать их вверх/вниз по тексту

  • простой способ быстро исправить неправильно сопоставленные сегменты

  • редактирование текста прямо в окне выравнивания

Подсвечивание ошибок

Подсвечивание возможных ошибок при выравнивании позволяет быстро проверить полученный вариант и не пропустить возможную ошибку. Выделяются такие ошибки как:

  • Неуверенно выровненные части текста

  • Строки с пустыми ячейками

  • Орфографические ошибки

Пакетное выравнивание

Поддержана загрузка пакета документов для автоматического выравнивания большого объема документов.

Форматы файлов для сохранения результата (экспорта)

TMX, RTF, внутренний формат программы ATA