Computer-aided
translation
tools |
В теории, теория и практика неразделимы. На
практике это не так (Yoggi
Berra)
Computer-aided
translation
tools
Машинный
(автоматический) перевод
(machine translation)
- перевод текста компьютером в автономном режиме.
Машинный
(автоматизированный) перевод
(machine-assisted translation)
- перевод текста с
использованием компьютерных систем и технологий.
Computer-Aided
Translation
(автоматизированный
перевод)
-
перевод текста на компьютере человеком.
Computer-aided
translation
tools
(CAT, в просторечии -
"кошки") - средства автоматизированного перевода.
|
Какая от кошек польза?
Применение CAT-средств
обеспечивает (при должной квалификации пользователя) :
-
единообразие
перевода, что положительно сказывается на его качестве;
-
высокий темп работ
по переводу за счет возможности не переводить одинаковые фрагменты
текста дважды. В результате, сокращаются сроки, необходимые на
перевод;
-
эффективность
учета замечаний заказчика - достаточно легко можно внести изменения
и дополнения по всей базе переводов, что позволяет мгновенно
исправить неточности в уже переведенных сегментах и избежать нового
появления подобных ошибок.
-
если исходный
документ предоставлен в одном из поддерживаемых форматов, то перевод
осуществляется без нарушения структуры документа. Фактически
необходимо лишь подправить текстовые фрагменты для устранения
несоответствия объемов текста оригинала и перевода.
-
снижение общей
стоимости перевода для заказчика. В отличие от обычных расчетов на
перевод, перевод с помощью CAT-средств тарифицируется по количеству
слов с учетом следующих параметров:
-
количество
одинаковых (повторяющихся) сегментов;
-
количество
сегментов, совпадающих с памятью переводов в процентном соотношении.
|
О любви к кошкам
Переводчики
всегда выступали против машинного перевода, поддерживая
использование компьютеров при переводе.
Мартин
Кей
(Martin
Kay, один из пионеров компьютерной лингвистики и классиков машинного
перевода и автоматизированного перевода, создателей алгоритмов
синтаксического анализа и унификационной грамматики) в
1980 году выдвинул тезис:
By taking over what is mechanical and routine, it
(computer) frees human beings for what is essentially human
(компьютер берет на себя рутинные операции и освобождает человека для
операций, требующих человеческого мышления).
kmp рекомендует:
A Life of
Language (речь Martin Kay на вручении Премии Ассоциации Компьютерной
Лингвистики, на англ. языке) |
|
Ларри Чаилдс
(Larry
Childs),
специалист по машинному
переводу, предложил
в 1990 году классификацию
систем машинного перевода:
-
FAMT
(Fully-automated
machine translation)
- полностью автоматизированный машинный перевод;
-
HAMT
(Human-assisted
machine translation)
- машинный перевод при участии человека;
-
MAHT
(Machine-assisted
human translation)
- перевод, осуществляемый человеком с использованием компьютера.
Широко
применяются при письменном переводе:
-
электронные словари и глоссарии,
-
программы извлечения терминологии,
-
Translation Memory,
-
корпуса,
-
конкордансы,
-
тезаурусы,
-
парсеры,
-
спеллеры,
-
другие лингвистические программные
средства и сетевые сервисы.
|
Информационные технологии
и перевод
Информационные технологии для перевода:
-
расширяют поле деятельности (как
основа сетевых коммуникаций, фактор
глобализации
экономики, культуры, образования),
-
создают новое поле деятельности
(компиляция и локализация программного обеспечения и сервисов),
-
реструктурируют и модернизируют
переводческую деятельность на основе использования
CAT,
предоставляют новый
инструментарий для переводоведения
открывают новое проблемное поле
для теории перевода (Ю.М. Лотман: Открывали Индию, а открыли
Америку)
создают среду осуществления
переводческой деятельности (влияя на писателя, читателя,
определяя ценность и хронотоп текста, особенности его создания,
восприятия, понимания, распространения).
Перевод для информационных технологий:
-
лежит в
основе современного
программирования (трансляция, компиляция, интерпретация,
виртуализация);
-
является условием
файловой организации информации (конвертирование форматов
данных)
-
представляет
собой
задачу
искусственного интеллекта
-
является
направлением развития
специализированных
информационных систем и сервисов
-
становится стандартной функцией
прикладного программного обеспечения (браузеры, текстовые и
табличные процессоры, коммуникативные программы)
-
является
необходимым инструментарием организации многонациональных
проектов и групп разработчиков.
09.11.2012
Глава
исследовательского отдела компании Microsoft Рик Рашид
(RickRashid) продемонстрировал прототип программы, которая
синтезирует твой голос на другом языке и позволяет человеку
разговаривать на чужом, незнакомом языке так же, как на
своем собственном. Рашид произносит фразу на английском языке, и с небольшой
задержкой аудитория слышит его же, говорящим по-китайски.
Результат получен на сонове синтеза разных технологий: распознавание речи,
электронный перевод, синтезатор речи с голосом конкретного
человека – но то, что происходит на восьмой минуте записи.
Перевод осуществлен Bing Translator
по технологии Deep Neural
Network, разработанной в Университете Торонто.
|
Лингвистические
информационные технологии
Язык
- единая многогранная многоуровневая реальность
(семиотическая, символическая, коммуникативная,
психологическая, культурная, информационная...), тесно
связанная с другими реальностями (семиотическими,
информационными, предметными...).
Различные уровни
и грани языка моделируются с помощью различных лингвистических
информационных технологий:
-
программирования (разработка, анализ и трансляция компьютерных
программ)
-
переводческих (технологии машинного перевода)
-
коммуникативных (технологии сетевого общения)
-
Тext
Miming (глубокий анализ текста, автореферирование)
-
эффективного
чтения (технологии экранного чтения, медленного чтения...)
-
лексикографических (технологии составления и применения
электронных словарей)
-
речевой
интерфейс (распознавание и понимание речи, синтез речи по
тексту...)
-
распознавания образов (системы оптического распознавания
текста...)
-
суггестивные
(фоносемантические технологии, технологии управления вниманием)
-
поисковых
(семантический поиск)
-
квантитативных (статистический анализ, построение частотных
словарей и конкордансов)
-
компьютерной
корректуры (орфографический, грамматический, стилистический
анализ)
-
форматирования и верстки (внешняя организация текста для
восприятия человеком или машиной.
.)
-
структурно-семантической разметки (HTML,
XML...)
-
искусственного интеллекта
(моделирование рассуждений, автогенерация текста, самообучение)
Все
лингвистические технологии являются частными ограниченными
моделями одной реальности (языка).
Общность объекта моделирования
предполагает возможность и необходимость взаимодействия различных
лингвистических технологий, дает значительный выигрыш в
эффективности их применения.
Часто, помимо качества перевода, художественности,
увлекательности переведенный рекламный текст
должен быть идентичен оригиналу по объему, разбивке на
абзацы, разделы, главы |
Эффективность переводческих технологий
(машинного перевода, TM, электронных
словарей) многократно усиливается на основе интеграции с другими
лингвистическими технологиями.
Эффективная деятельность переводчика
невозможна вне использования современных информационных
лингвистических технологий, даже в том случае, если он не использует
CAT (средства автоматизированного перевода). |
Результаты опроса пользователей CAT
Здесь
Программное
обеспечение для переводчика.
Доклад
Александра Цемахмана, Арифа Гаджиева
на Третьем ежегодном круглом столе по вопросам
практического перевода (Самара, 30-31 мая 2009г.)
(PDF-документ) |
Результаты опроса пользователей CAT
Здесь
Результаты
опроса пользователей CAT
(июль-август 2010).
PDF-документ |
Программы извлечения терминологии
Особую значимость составление
собственного глоссария приобретает при переводе больших объемов
текста, если присутствует несколько файлов на перевод с единой
терминологией (например, серия технических руководств).
Использование глоссария позволяет, в
таком случае, сохранить единство терминологии при переводе и
сэкономить время, необходимое на поиск нужного варианта перевода.
Кроме того, после завершения работы и
сдачи перевода заказчику, глоссарий сохраняется у вас для возможного
повторного использования.
Популярные программы автоматизированного
извлечения терминологии:
|
Цикл перевода
|
наименование этапа |
примечание |
|
чтение как перевод |
|
|
письмо как перевод (предчувствие
читателя) |
И. Бродский: Я ... |
|
предчувствие
возможности перевода |
ср.
интернационализация программного обеспечения |
|
чтение
(с пониманием) |
нет более внимательного читателя, чем переводчик |
|
анализ
текста |
|
|
подготовка текста
(корректура, сегментация, редактирование) |
|
|
работа с форматами документов для перевода |
|
|
процесс перевода |
таинственный |
|
редактирование
перевода |
|
|
предварительная
корректура |
|
|
предварительная
конвертирование перевода в целевой формат |
|
|
верстка перевода |
|
|
окончательная
корректура перевода |
|
|
чтение как перевод (текста, мира автора,
мира переводчика) |
|
|