Computer-aided translation tools

 

 

 В теории, теория и практика неразделимы. На практике это не так (Yoggi Berra) 

 

 

Computer-aided translation tools

 

Машинный (автоматический) перевод (machine translation) - перевод текста компьютером в автономном режиме.

Машинный (автоматизированный) перевод (machine-assisted translation) - перевод текста с использованием компьютерных систем и технологий.

Computer-Aided Translation (автоматизированный перевод) -  перевод текста на компьютере  человеком.

Computer-aided translation tools (CAT, в просторечии - "кошки") - средства автоматизированного перевода.

 

 

 

Какая от кошек польза?

 

Применение CAT-средств обеспечивает (при должной квалификации пользователя) :

  1. единообразие перевода, что положительно сказывается на его качестве;

  2. высокий темп работ по переводу за счет возможности не переводить одинаковые фрагменты текста дважды. В результате, сокращаются сроки, необходимые на перевод;

  3. эффективность учета замечаний заказчика - достаточно легко можно внести изменения и дополнения по всей базе переводов, что позволяет мгновенно исправить неточности в уже переведенных сегментах и избежать нового появления подобных ошибок.

  4. если исходный документ предоставлен в одном из поддерживаемых форматов, то перевод осуществляется без нарушения структуры документа. Фактически необходимо лишь подправить текстовые фрагменты для устранения несоответствия объемов текста оригинала и перевода.

  5. снижение общей стоимости перевода для заказчика. В отличие от обычных расчетов на перевод, перевод с помощью CAT-средств тарифицируется по количеству слов с учетом следующих параметров:

  • количество одинаковых (повторяющихся) сегментов;

  • количество сегментов, совпадающих с памятью переводов в процентном соотношении.

 

 

 

О любви к кошкам

 

Переводчики всегда выступали против машинного перевода, поддерживая использование компьютеров при переводе.

Мартин Кей (Martin Kay, один из пионеров компьютерной лингвистики и классиков машинного перевода и автоматизированного перевода, создателей алгоритмов синтаксического анализа и унификационной грамматики) в 1980 году выдвинул тезис: By taking over what is mechanical and routine, it (computer) frees human beings for what is essentially human (компьютер берет на себя рутинные операции и освобождает человека для операций, требующих человеческого мышления).

kmp рекомендует:  A Life of Language (речь Martin Kay на вручении Премии Ассоциации Компьютерной Лингвистики, на англ. языке)

Ларри Чаилдс (Larry Childs), специалист по машинному переводу, предложил в 1990 году классификацию систем машинного перевода:

  • FAMT (Fully-automated machine translation) - полностью автоматизированный машинный перевод;

  • HAMT (Human-assisted machine translation) - машинный перевод при участии человека;

  • MAHT (Machine-assisted human translation) - перевод, осуществляемый человеком с использованием компьютера.

Широко применяются при письменном переводе:

  • электронные словари и глоссарии,

  • программы извлечения терминологии,

  • Translation Memory,

  • корпуса,

  • конкордансы,

  • тезаурусы,

  • парсеры,

  • спеллеры,

  • другие лингвистические программные средства и сетевые сервисы.

 

 

 

 

Информационные технологии и перевод

 

Информационные технологии для перевода:

  • расширяют поле деятельности (как основа сетевых коммуникаций, фактор глобализации экономики, культуры, образования),

  • создают новое поле деятельности (компиляция и локализация программного обеспечения и сервисов),

  • реструктурируют и модернизируют переводческую деятельность на основе использования CAT,

  • предоставляют новый инструментарий для переводоведения

  • открывают новое проблемное поле для теории перевода (Ю.М. Лотман: Открывали Индию, а открыли Америку)

  • создают среду осуществления переводческой деятельности (влияя на писателя, читателя, определяя ценность и хронотоп текста, особенности его создания, восприятия, понимания, распространения).

Перевод для информационных технологий:

  • лежит в основе современного программирования (трансляция, компиляция, интерпретация, виртуализация);

  • является условием файловой организации информации (конвертирование форматов данных)

  • представляет собой задачу искусственного интеллекта

  • является направлением развития специализированных информационных систем и сервисов

  • становится стандартной функцией прикладного программного обеспечения (браузеры, текстовые и табличные процессоры, коммуникативные программы)

  • является необходимым инструментарием организации многонациональных проектов и групп разработчиков.

09.11.2012

Глава исследовательского отдела компании Microsoft Рик Рашид (RickRashid) продемонстрировал прототип программы, которая синтезирует твой голос на другом языке и позволяет человеку разговаривать на чужом, незнакомом языке так же, как на своем собственном. Рашид произносит фразу на английском языке, и с небольшой задержкой аудитория слышит его же, говорящим по-китайски.

Результат получен на сонове синтеза разных технологий: распознавание речи, электронный перевод, синтезатор речи с голосом конкретного человека – но то, что происходит на восьмой минуте записи. Перевод осуществлен Bing Translator по технологии Deep Neural Network, разработанной в Университете Торонто.

 

 

 

 

Лингвистические информационные технологии

 

Язык - единая многогранная многоуровневая реальность (семиотическая, символическая, коммуникативная, психологическая, культурная, информационная...), тесно связанная с другими реальностями (семиотическими, информационными, предметными...).

Различные уровни и грани языка моделируются с помощью различных лингвистических информационных технологий:

  • программирования (разработка, анализ и трансляция компьютерных программ)

  • переводческих (технологии машинного перевода)

  • коммуникативных (технологии сетевого общения)

  • Тext Miming (глубокий анализ текста, автореферирование)

  • эффективного чтения (технологии экранного чтения, медленного чтения...)

  • лексикографических (технологии составления и применения электронных словарей)

  • речевой интерфейс (распознавание и понимание речи, синтез речи по тексту...)

  • распознавания образов (системы оптического распознавания текста...)

  • суггестивные (фоносемантические технологии, технологии управления вниманием)

  • поисковых (семантический поиск)

  • квантитативных (статистический анализ, построение частотных словарей и конкордансов)

  • компьютерной корректуры (орфографический, грамматический, стилистический анализ)

  • форматирования и верстки (внешняя организация текста для восприятия человеком или машиной. .)

  • структурно-семантической разметки (HTML, XML...)

  • искусственного интеллекта (моделирование рассуждений, автогенерация текста, самообучение)

Все лингвистические технологии являются частными ограниченными моделями одной реальности (языка).

Общность объекта моделирования предполагает возможность и необходимость взаимодействия различных лингвистических технологий, дает значительный выигрыш в эффективности их применения.

 

Часто, помимо качества перевода, художественности, увлекательности  переведенный рекламный текст должен быть идентичен оригиналу по объему, разбивке на абзацы, разделы, главы

 

Эффективность переводческих технологий (машинного перевода, TM, электронных словарей) многократно усиливается на основе интеграции с другими лингвистическими технологиями.

Эффективная деятельность переводчика невозможна вне использования современных информационных лингвистических технологий, даже в том случае, если он не использует CAT (средства автоматизированного перевода).

 

 

 

 

Результаты опроса пользователей CAT

 

Здесь  Программное обеспечение для переводчика. Доклад Александра Цемахмана, Арифа Гаджиева на Третьем ежегодном круглом столе по вопросам практического перевода (Самара, 30-31 мая 2009г.) (PDF-документ)

 

 

 

 

Результаты опроса пользователей CAT

 

Здесь Результаты опроса пользователей CAT (июль-август 2010). PDF-документ

 

 

 

 

Программы извлечения терминологии

 

Особую значимость составление собственного глоссария приобретает при переводе больших объемов текста, если присутствует несколько файлов на перевод с единой терминологией (например, серия технических руководств).

Использование глоссария позволяет, в таком случае, сохранить единство терминологии при переводе и сэкономить время, необходимое на поиск нужного варианта перевода.

Кроме того, после завершения работы и сдачи перевода заказчику, глоссарий сохраняется у вас для возможного повторного использования.

Популярные программы автоматизированного извлечения терминологии:

 

 

 

 

Цикл перевода

 

 

наименование этапа

 примечание

 

чтение как перевод

 

 

письмо как перевод (предчувствие читателя)

И. Бродский: Я ...

 

предчувствие возможности перевода

ср. интернационализация программного обеспечения

 

чтение (с пониманием)

нет более внимательного читателя, чем переводчик

 

анализ текста

 
 

подготовка текста (корректура, сегментация, редактирование)

 

 

работа с форматами документов для перевода

 

 

процесс перевода

таинственный

 

редактирование перевода

 

 

предварительная корректура

 

 

предварительная конвертирование перевода в целевой формат

 

 

верстка перевода

 

 

окончательная корректура перевода

 

 

чтение как перевод (текста, мира автора, мира переводчика)