Machine literary translation

 

 

МП не предназначен...

 

Машинный перевод не предназначен для перевода художественной литературы!

Однако, это не значит, что он не может быть использован для художественного перевода!

Светлана Соколова (председатель совета директоров Промт):

  • Конечно, машинный переводчик не предназначен для перевода художественной литературы. Программа спроектирована так, чтобы генерировать усредненные конструкции, тем самым обеспечивая определенную устойчивость перевода.

  • Однако, практически каждый пользователь хотя бы раз пробовал перевести что-нибудь из художественной литературы. Как ни странно, у некоторых результат оказывался довольно интересным.

 

 

О "непредназначенности" ...

 

Любое искусство рождается из "изначальной непредназначенности":

  • старейший "музыкальный инструмент" - человеческое тело (звуки возникали из-за удара по груди или бедру). Постепенно люди каменного века стали использовать предметы, чтобы себя предостеречь от опасности: ритмичными ударами одного камня о другой. Струнные произошли от охотничьего лука, духовые - от раковины, рога, тростника. Позже эти инструменты использовались для общения... для искусства...

Изначально не предназначены (с научно-исторической точки зрения):

  • тело для танца

  • голос и речь для оперного пения

  • смальта для мозаики

  • фотография для ...

  • компьютеры для игровых вселенных ...


Предназначенность искусства - вторично:

  • искусство не "для чего-то" (пользы, здоровья, эффективности).

  • эстетическое не сводимо к чему бы то ни было (нравственному, физическому, логическому, экономическому...).

  • прекрасное не "предназначено для ...",  оно самоценно и имеет цель в себе самом


Самоценность искусства - в человеке

  • искусство всегда "для кого-то" (эстетического человека).

  • каков человек, таково и его искусство...

  • особенности современного искусства (живописи, музыки, поэзии) отражают перемены в человеке
    (современном, пост-современном, вечном)

  • техника - продолжение человека, отрывающее ему новые горизонты своей самости, среди которых он может потеряться ... убедив самого себя что он машина с био-компьютером в голове... :)


 

Анатолий Старостин (руководитель группы семантического анализа компании ABBYY):

  • Я занимаюсь извлечением информации из текстов. Она близка к переводу, потому что перевод — это тоже извлечение информации, но немного другой акцент. В тех задачах, которые я решаю в последнее время, обычно заранее исчисляется, что именно мы хотим извлекать из текстов, и эту информацию мы стараемся извлекать хорошо и качественно.

21.03.2020 

Компьютерный перевод не предназначен для...    Роботы не предназначены для пения )
Альбом робота-музыканта Shimon будет на Spotify в апреле 2020 и он отправится в тур в поддержку своего творения

 

 

 

Ошибочность требований

 

Очевидно:

  • Самолет не птица, автомобиль - не лошадь... их качество несоизмеримо!

Наивно (узость горизонта сознания):

  • требовать от самолета "качественного птичьего полета"
    Полет самолета может быть
    качественным или нет, но это иное качество, чем полет птицы

  • сравнивать качество полотен Эжена Делакруа и Пабло Пикассо (см. Алжирские женщины в своих покоях)

  • требовать от компьютера качественного "человеческого" перевода"
    Художественный машинный перевод может быть качественным или нет, но это иное качество

  • требовать от компьютера именно реалистического перевода в эпоху хужодественных игр, перформансов и инсталляций, в том числе и в области переводов...

  • требовать от компьютера качественного "реалистического художественного перевода" далеких от реализма текстов ...


Переводчик переводит тексты, написанные людьми для людей (а не пропетые соловьями для соловьев)
Машина отлично переводит тексты сгенерированные машинами для машин

Машинный перевод для людей текстов созданных людьми для людей - это ... нечто сверхчеловеческое?

 

 

 

 

Безрассудность суждений

 

Основные причины ошибочности суждений о машинном художественном переводе:

  • подмена знания (epistema) мнением (doxa)

  • игнорирование (незнание) контекста (исторического, культурного, литературного, переводческого, языкового, социального, антропологического)...

  • абсолютизация ограниченного и ошибочно интерпретируемого личного опыта...

  • логическая ошибки в суждениях и умозаключениях...

  • когнитивные искажения...

kmp рекомендует: Список_когнитивных_искажений


В учебном курсе ОИТ (1 курс) Орлова Е.А. не смогла определить авторство стихов (человек или машина).
Результат здесь

Анатолий Старостин уководитель группы семантического анализа компании ABBYY):

  • Если ты знаешь язык, ты отличаешь машинный текст от немашинного за несколько секунд.

Зачем человек не знающий и не любящий поэзии судит о машинном переводе поэзии?

В учебном курсе КП (4 курс) Орлова Е.А. требует от компьютера ... самолета, чтобы он садился на ветку, как птица
(и на меньшее не согласна!)

Но кто такая Орлова?
и что
Орлова значит со своими требованиями и несогласиями?

 

 

 

Стиховедческое качество перевода

 

Анатолий Старостин уководитель группы семантического анализа компании ABBYY):

  • Сейчас есть прекрасный мировой тренд на оцифровку художественных произведений..

  • Я сам иногда занимаюсь стиховедческими задачами. Например, есть отдельная ветка алгоритмов, связанных с определением метра стихотворения и разных стиховедческих характеристик.

  • Стиховеды — люди очень интересные, их по-настоящему интересуют цифры в стихах. Их интересует сколько строчек, какой формы, какого размера в том или ином стихотворении. Например, их может интересовать, сколько третьих форм четырехстопного ямба в стихах Есенина определенного периода. Это само по себе является важным для них знанием, из этого дальше делаются уже чисто стиховедческие выводы. Такие вещи считать с помощью компьютера очень удобно. Сильно экономит время и силы, и можно заниматься дальше более сложными задачами.

  • Качественный машинный перевод поэтических текстов в настоящее время невозможен. Вряд ли в ближайшее время где-нибудь проснется робот, который заговорит с нами на равных.

Вопрос:

  • что значит качественный перевод поэтических текстов для стиховедов,
    которых "
    по-настоящему интересуют цифры в стихах"?

 

 

 

 

Да здравствует машинный перевод!

 

Альбина была на Крещенье в Крыму.

Было холодно.
С подругой Галей они не решились
погрузитья в реку, но омыли свои
лица в крещенской воде.

Об этом Альбина написала по английски:

but we washed our faces with the river water

Просто и понятно без переводчика.
Но механический переводчик выдал строки,
дышащие высокой русской поэзией:

Но мы стирали наши лица
с речной воды....

Не совсем то, что сказала
Альбина Кликс по английски, но гениально.
Не жаль и повторить.

Да здравствует машинный перевод!


См. Альбина Лейбман-Кликс "Гротеск как модус операнди в произведении искусства"
ср. там: Диего Веласкес "Pope Innocent X" 1650 (Галлерея Дориа - Памфили, Рим) и Франсис Бэкон. Гротескное переосмысление портрета Диего Веласкеса Pope Innocent X., 1953

 

 

 

Google Translate Songs

Звезда Голливуда Энн Хэтэуэй на The Tonight Show (популярнейшее шоу в США) в рубрике «Google Translate Songs» (исполнение песен, тексты которых переведены Google Translate —  с английского на другие языки и обратно) исполнила версию песни «I Cant Feel My Face» («Я не чувствую свое лицо») в виде «My front is not felt» («Мой перёд не ощущается»).

Ведущий Джимми Фэллон исполнил хит Глории Гейнор «I Will Survive», который в версии машинного перевода стал звучать, как «Я никогда не буду пунктуальным».

Новые версии хорошо известных песен привели публику в восторг.

https://www.youtube.com/watch?v=4GC83w0z0ec

 

 

 

«Borgy&Bes»

16.03.2018   Связать науку и искусство

Инсталляция «Borgy&Bes», созданная с использованием обучаемых нейронных сетей.

На глазах у публики «Borgy&Bes» ведут диалог: не просто читают новости в интернете, но и переводят новостные сводки на язык Достоевского. 

 

 

 

"Successful Thrust" by MC Google Translate

Dan Luuывший сотрудник Google, специалист в области машинного обучения) обнаружил, что если последовательно вводить в окно Google Translate два японских иероглифа, добавляя два аналогичных знака в каждой последующей строке, сервис переводит это как стихи.

Своим опытом он поделился в Twitter.

 

 

Эксперименты показали, что как бы ни начинались подобные «стихи» от Google Translate,  оканчиваются  они тем,  что «лирический герой» испытывает страх.

Были предложены десятки вариантов «стихотворений», которые смонтированы в клип

 

 

 

Машинный перевод «Короля Лира»

 

06.06.2004

Компьютер замахнулся на Вильяма нашего Шекспира

В киевском Центре театрального искусства им. Леся Курбаса готовится премьера пьесы Шекспира «Король Лир».

Перевод пьесы выполнен компьютером.

Компьютерный вариант Шекспира, поставленный на солидной сцене - значимая веха в истории машинного перевода.

Александр Остапенко (режиссер киевского Центра театрального искусства им. Леся Курбаса, автор идеи):

  • Я давно собирался поставить спектакль на основе оригинальных текстов Шекспира. Но любой перевод классика является фактически самостоятельным литературным произведением. Тексты Пастернака или Маршака несут в себе собственное восприятие переводчиком той эпохи характеров и отношений. Это восприятие неизбежно наслаивается на авторскую индивидуальность.

  • Очень сложно было найти редактора-переводчика (человека), который согласился бы «наступить на горло» собственной переводческой амбиции. И тогда я решился обратиться за помощью к российским разработчикам компьютерных программ перевода.

  • Результат оказался неожиданным. Вот фрагмент из варианта выполненного системой «ПРОМТ»: «Я так часто краснел, чтобы признать его, что теперь покрылся медью». Здесь любой редактор старался бы подобрать эквивалент в русском языке. Но при таком переводе теряется еще один смысл, еще одно ощущение – металл, доспехи... Краснел, был беззащитен и вдруг – защищен доспехами цвета меди.

  • Безусловно, тексты, получившиеся у людей-переводчиков звучат гораздо изящнее и поэтичнее. Но, с точки зрения смысла, машина не слишком отстает от человека, более того – кое-где она позволяет сохранить больше оригинальной информации.

  • В машинном варианте Лир говорит: «Мы выразим нашу цель // Которая в тени была». В то же время у Пастернака секретность плана отображена не так очевидно: «Заветные решенья...», а у Дружинина идея короля вообще не имеет оттенка тайны: «Передадим наш замысел давнишний...».

  • Удивительное свойство,  которое присуще машинному переводчику, его, порой, формальный поход к тексту иногда оказывается способен пробудить взрыв ассоциаций… Вдруг стало понятно, как должны быть одеты люди, которые ТАК говорят. Вдруг стало понятно, для какого театрального помещения писалась эта пьеса – конечно, для специфичного зрительного зала театра «Глобус». Вдруг оказалось, что речь короля Лира от начала пьесы к концу пьесы изменяется так, как изменяется его характер. Это догадка, до конца еще далеко, но это в логике пьесы.

 

 

 

Google Переводчик - соавтор

 

17.09.2016

Театр Наций (http://www.theatreofnations.ru) открыл сезон спектаклем (драматическим перформансом) «Заводной апельсин».
О
фициальным соавтором текста указан Google Переводчик.

Филипп Григорьян (режиссер):

  • Мы не ставим спектакль по роману "Заводной апельсин" Энтони Берджесса. В некотором смысле этот спектакль о взаимоотношении романа с его автором. Это не биографический роман про Берджесса. В любом случае, это фантасмагорическое пространство.

  • Мы пропустили текст через Google Переводчик. То, что получилось, стало элементом «драматического перформанса».  Художественный прием должен помочь передать русскоязычным зрителям эффект языка надсат (вымышленного арго в оригинальном тексте Берджеса).

  • Это история о насилии, в том числе о насилии над языком.

Илья Кухаренко (автор драматургической концепции ):

  • В своем романе Берджесс использует надсат – вымышленный арго - смесь сленга кокни, искаженных слов русского языка.

  • Где-то состарился жаргон. Мы уже так не говорим, как в 60-е годы в Ленинграде. Ты понимаешь, что этот роман начинает отдаляться, а задача была максимально этот текст приблизить, сделать болезненными ощущения.

  • Это история о том, как человек сталкивается со злом, как пытается его понять и примерить на себя, как болезненные эмоции рождают произведение искусства.

Андрей Смоляков (народный артист России, в главной роли писателя):

  • Тарабарщину запоминать забавно!

  • Тем более она такая интересная, информативная, при всех своих переводах из Google на один язык, потом наоборот.

  • Это попытка взорвать текст эмоционально

См. о спектакле:

Журнал Иностранная литература 2017, 2 посвящен Энтони Бёрджессу
(не все материалы свободно доступны в Сети, однако ...)

Nadsat (-надцать):

 

 

 

Машинный переводчик поэзии

 

11.10.2010 Google презентовал на EMNLP 2010 ( Conference on Empirical Methods in Natural Language Processing at the MIT Stata Center, Massachusetts, USA) программу для перевода поэтических текстов на базе переводчика Google Translate.

Разработчики Google Translate: Дмитрий Гензель (уроженец Харькова), венгр Якоб Ускорейт и немец Франц Ох.

Дмитрий Гензель:

  • Это типичная AI-полная задача.
    Перевод стихотворения сложен и для человека, что уж говорить о машине.  Нам пришлось искать другой принцип, отличный от того, что использует при переводе  Google Translate, руководствующийся статистическими данными об употребляемости словосочетаний. Стихи по такой схеме вряд ли сложишь.
    Можно сказать, что мы поступились стопроцентной точностью во имя художественности перевода и новый продукт, в котором мы решили поэкспериментировать с переносом не только смысла, но и формы  приятно удивил нас своими  результатами.

Разработчики отмечают и «приятный побочный эффект» нового продукта: можно будет любую прозу превратить в стихи, причем выбирая конечный ее размер и жанр, либо позволяя системе самой выбрать подходящую форму. По такому же принципу можно будет при переводе менять размер и стихотворного произведения. Французскую строку из «Монографического эссе о Гвоздике пиренейской» система перевела на английский «в виде пары куплетов ямба». Эпопея «Генриада» Вольтера была преобразована в дактилический тетраметр, а старинную французскую поэму «Зеркало простых душ» переделана в хайку.

 

kmp рекомендует:

статья о проекте обучения компьютера переводу стихотворных текстов (сентябрь 2010)

 

Дмитрий Гензель: Главная проблема заключается даже не в распознавании метрического строя и поиске рифм, не в подборе точных значений, а в передаче плохо уловимой субстанции, называемой поэтикой.

 

  • Самая простая стихотворная форма (не содержание!) — японское хайку: достаточно запрограммировать машину на генерацию строчек с определённым количеством слогов.

  • Далее: классический пятистопный ямб. Компьютер воспользуется словарём, разберётся с ударениями.

  • Сложнее с рифмой. Придётся снабдить машину базой синонимичных слов и выражений, смысловая схожесть которых должна будет балансировать на грани едва уловимых ассоциаций. Но ведь у каждого поэта разная взаимозаменяемость понятий, разная картина мира, отражением которой, собственно, и служит поэтический язык... Увы, ничего лучше перебора вариантов программисты Google пока придумать не в состоянии.

  • О других тонкостях (аллитерация, ассонанс, синтаксический параллелизм и мн. др.) речь пока не идёт....

 

Доклад "Poetic" Statistical Machine Translation: Rhyme and Meter  Dmitriy Genzel and Jakob Uszkoreit см.: http://www.lsi.upc.edu/events/emnlp2010

Фрагмент лекции Дм. Гензеля https://www.youtube.com/watch?v=fV1k44y-XDo

 

 

Эксперименты Facebook Research

 

 

Что интересует Орлову
с задворков культурного мира

 

Орловой Е.А. всё это может быть совершенно не интересно :(

Но в мировой культуре никому не интересны: ни сама Орлова Е.А., ни ее интересы :)

 

 

 

 

Сам себе переводчик

Сентябрь 2011

Компания PROMT совместно с Softkey.Ru,Adobe и CyberLink провела конкурс «Сам себе переводчик» (смешные переводы фильмов, выполненные PROMT (Translate.Ru) и присланные пользователями).

30.09.2011

29 сентября закончилось голосование на 

За работы конкурса смешных переводов «Сам себе переводчик»  подано около 600 голосов; тысячи просмотров...

  • Гран-при: ролик «Агент Джонни Инглиш: Рожденный заново».

  • Приз зрительских симпатий: «Гарри Поттер и Камень Волшебника».

  • Специальная премия: «Казино Шелковый Репс».

См. https://www.youtube.com/watch?v=TDrARN9SBTQ

Способность к самоиронии - хороший признак!

 

 

 

МХП предназначен...

 

  • для искусства (как реализация растущего запроса на машинное искусство, новые формы и способы осмысления человека в техносфере... информационном обществе потребления)

  • для лингвистики и поэтики (как средство расширения их предметности, через выявление новых сторон в изучаемых объектах; как инструментарий исследования, как новые задачи и цели... )

  • для Digital Humanities (см. https://litlab.stanford.edu )

  • для Computer Science ( новые проблемы, задачи, методы, алгоритмы, языки, решения, проблемы...)

  • для психологии и антропологии - осмысление современного человека через его новые потребностии запросы...

 

 

 

 

Всем морники :)

перевод в искусстве медиа-клоунады

Эксперт (по разводу сетевых обывателей) Дима с медиа-клоунадой:

Для умных :)

Для сомневающихся (НИКОМУ НЕ ПОБЕДИТЬ клоунов-контроллеров):

 

 

 

Компетентное мнение о МХП

Формула перевода:

  • перевод = чтение (как результат письма писателем) + интерпретация + письмо (как предпосылка чтения читателем)

Компетентное мнение о художественном машинном переводе должно основываться:

  • на знании художественной литературы в ее развитии и потенции, ее современного состояния (даже если оно лично вам не нравится), тенденций

  • на знании истории и теории перевода, его современного уровня и тенденций развития
    на знании истории теории чтения,
    его современного уровня и тенденций развития (см. о чтении)

  • на знании герменевтики (теории интерпретации), современных интерпретативных практик, тернденций их развития

  • на знании общих тендеций развития культуры...

  • на знании теории, истории и практик порождения текста (грамматология +)

 

 

 

Технопоэйя

 

    Дар слова.  Проективный лексикон русского языка Михаила Эпштейна.  24 января 2011

    http://www.emory.edu/INTELNET/dar0.html

    ТехнопоЭйя (греч. techne -искусство, ремесло + греч. poiein, создавать; ср. мифопоэйя, логопоэйя) - поэтическая сторона  техники как деятельности, воплощающей творческие устремления человека и символическое видение мира.

    Технопоэйя - техника как поэзия -  позволяет прозревать незримое, слышать неслышимое, глаголить многими языками, доносить свое слово до краев мира. Подобно пушкинскому "шестикрылому серафиму", она распахивает пространства земли и неба, утверждает многомерность и вездесущность духа.

    Мосты, раскинувшиеся над реками как рукотворные радуги; виртуальные миры, приносящие нам свободу фантазий и первоплощений, - все это технопоэйя.

    Техника не менее метафорична и символична, чем поэзия, только она воплощает эту энергию созидания не в словах, а в  поэтически преображенной материи, где каждый элемент "играет" с природой, преодолевает силу тяжести, дальность расстояний, ограниченность тела.

    Технопоэйя - это техника как продолжение поэзии иными конструктивными  средствами.

     


     

    Современная культура - готовый, законченный текст.
    Невозможность прямого высказывания, обреченность на цитату - один из главных мотивов современного искусства.
    Память жанра, ритма, стиля - наиболее интенсивно работающие механизмы современной художественной практики.

    Не только художественное, но и обиходное речевое поведение - это лишь обмен цитатами.
    Мы цитируем не только тексты, но и интонации, и стили, и типы сознания.
    Мы и сами в каком-то смысле ходячие цитаты.
    Это данность...

 

 

внекомпьютерный перевод

  • …За шестьдесят лет занятий стихотворными переводами у меня сложилось подобие обряда, которым я обычно следую. После того, как я несколько раз вслух и про себя прочту текст на языке подлинника, он удерживается в моей памяти. А дальше его начинает переиначивать и пересказывать по-русски недремлющий во мне любитель толкований и дешифровок. Большая часть его работы проходит вне поля моего сознания: эта бессознательная деятельность по замене одного ряда символов другим... Потом вдруг появляются русские строки, которые словно мне приснились. Иногда это всего одна строка, а следующей приходится дожидаться годами...

 

 

 

Как опубликовать перевод художественной книги в России

Александра Старусева-Першеева, Фотография как способ видения

  • Еще одна тема для споров и исследований — фотография как вид искусства. В каком случае об этом можно говорить всерьез?
    «Разве это может быть искусством, если ты просто нажимаешь на кнопку?» Если отвечать коротко: да, может.

 

 

 

kmp