четверг, 23-02-2017

КОМПЬЮТЕРНЫЙ ПЕРЕВОД

Дата - зачтено

Дата - ладно, зачтено

Дата - не зачтено

 

 

Русское правописаніе
http://www.russportal.ru/index.php?id=oldorth

славеница — проектъ объединяющій славянскія письменности и развивающій новый подходъ къ переводу текстовъ на славянскихъ языкахъ.
http://slavenica.com


Викитека
https://ru.wikisource.org/wiki/Раздѣлъ:_Дореформенная_орѳографія

Словарь дореволюціонной орѳографіи съ удареніями. 1914 годъ.
http://www.dorev.ru/ru-index.html

https://ru.wikipedia.org/wiki/Русская_дореформенная_орфография

 

https://habrahabr.ru/post/321048/
Анализ и перевод языка пришельцев с помощью Wolfram Language

 

 

переводчик на эмодзи
переводчика Pilot
https://habrahabr.ru/post/322446/

 

  • Почтовый адрес М.П. Концевого: kmp@brsu.by или  kmp45@yandex.ru

  • Письмо  из учебной аудитории отправляется через сайт mail.brsu.by (логин: student, пароль: 24690274)

  • Обязательная форма темы письма: 40X-Фамилия-название работы

  • Все работы должны иметь отзыв по форме

Худякова

Курсанов

Наумова

Михаленя

...

 

компиляция

межсемиотический перевод

перевернутый текст (калькуляторы)
инфографика
браузер как переводчик

программирование как перевод
Wordfast - это программа автоматизированного перевода (CAT), разработанная в качестве надстройки для Microsoft Word https://www.wordfast.net/index.php?lang=ru01
перевод на дореформенный + старославянский

КП в языковом образовании

API (переводчик Яндкеса в Википедии + Baidu + Promt + виджет + словари Лингво)...

API (переводчик Яндкеса в Википедии

аннотирование + автореферирование +информационный стиль + TextMining

Вопросы и семинары с ответами

 

Нейронный машинный перевод с применением GPU. Часть 1 ...
http://datareview.info/article/neyronnyiy-mashinnyiy-perevod-s-primeneniem-gpu-vvodnyiy-kurs-chast-1/

Нейронный машинный перевод с применением GPU. Часть 2 ..
http://datareview.info/article/neyronnyiy-mashinnyiy-perevod-s-primeneniem-gpu-vvodnyiy-kurs-chast-2/

 

 

407

СTr201A1DfPELLDALSBelOnLTTPrPr2P4PreTMDVDV2SubLocLoc2
Бохон                     
Бурштын                     
Верич                     
Галушко                     
Корнеева                     
Джанов                     
Михаленя                     
Наумова                     
Селивончик                     
Семенюк                     
Скробот                     
Ящук*                     
deadline                     

408

                     
Козик                     
Кристя                     
Кульба                     
Лопатко                     
Микитюк*                     
Москаленко                     
Мясникова                     
Парафинюк                     
Пархутик                     
Свитич                     
Синютич                     
Терешко                     
Юхимук                     
deadline                     

409

                     
Вакульчик                     
Веремейчик                     
Данилевич                     
Зиневич                     
Карпиевич                     
Климович                     
Коротыш                     
Круп                     
Леоновец                     
Мирчук                     
Ноздрин-Пл.*                     
Сайков                     
Шульгова                     
Янковский                     
deadline                     

410

                     
Гошко                     
Дубойская                     
Зыщук                     
Каленкович                     
Леонюк                     
Малыхина                     
Пешко                     
Стельмашук                     
Трофимук                     
Циш                     
Шикеля                     
Шурина                     
Якубович*                     
deadline                     

 

Ящук               

 

 

ЛК (14 часов):

  • Понятие компьютерного перевода
    Профессиональный компьютерный перевод
    Компьютерная лексикография
    Технологии компьютерного перевода
    Понятие и классификация технологий компьютерного перевода
    Системы и сервисы компьютерного перевода
    Качество перевода

ПРАКТ (42 часа + 10):

  • Понятие компьютерного перевода

    Компьютерный перевод в мире

    Профессиональный компьютерный перевод

    Технологии компьютерного перевода

    Системы компьютерного перевода

    Системы компьютерного перевода

    Средства компьютерного перевода

    Средства компьютерного перевода

    Компьютерная лексикография и терминография

    Компьютерная лексикография и терминография

    Тranslation Мemory

    Тranslation Мemory

    Переводческие ресурсы Интернета

    Переводческие ресурсы Интернета

    Качество компьютерного перевода

    Качество компьютерного перевода

    Качество компьютерного перевода

    Качество компьютерного перевода

    Кроссмодальный компьютерный перевод

    Интернационализация и локализация

    Интернационализация и локализация

 

  • Блог Яндекса
    Как это будет на папьяменто?
    https://yandex.ru/blog/company/kak-eto-budet-na-papyamento?from=email
    Ссылки
    Как Яндекс научил машину самостоятельно создавать переводы для редких языков — дополнительные подробности на «Хабрахабре».
    Яндекс.Переводчик — переведёт слово, словосочетание, предложение, текст или целый сайт с русского на папьяменто и ещё на 89 языков. И обратно тоже.
    Статья «Машинный перевод» — расскажет, как устроен статистический машинный переводчик Яндекса в целом.

    Не пытались использовать SyntaxNet?
    Если Вы говорите про парсинг предложения на малом языке с помощью SyntaxNet — так просто сделать не получится, так как для обучения SyntaxNet требуются составленные лингвистами сложные обучающие данные наподобие Universal Dependencies. Обычно составление таких корпусов занимает многие месяцы и даже годы ручного труда.

    Насколько я знаю, Гугл для языков с очень большим объёмом параллельных текстов использует end-to-end нейросети, в том числе в продакшне. Для большинства обычных — просто статистический подход с самой простой языковой моделью — Stupid Backoff. Хитрые вещи с морфологией они не делают, надеясь на просто языковую модель. Нейросети правда частично решают эту проблему, так как гугловская модель использует не слова, а subword units, что будет приводить к сегментации на что-то, похожее на морфемы, но я подробностей про русский не слышал. Разве что параллельный корпус у них примерно на 0.3B предложений.

    Переводы машины сравниваются с переводами людей. Подробнее тут https://en.wikipedia.org/wiki/BLEU

    Знаете классическую ошибку тех, кто прочитал пару статей и думает, что он разбирается в синдарине? Эта ошибка называется «Ошибка Гэндальфа» и она нам видна в «Lord of the Rings». Когда Митрандир смотрит на ворота Мории он там видит надпись «Pedo mellon a mino», но он не помнит(или не знает, ибо не жил в Смертных Землях), что у синдарина были диалекты. Он рассуждает, что эта надпись значит что если ты друг, то знаешь пароль по той простой причине, что надпись требующая сказать слово друг писалась бы через vellon, а не mellon, он не понимает, что в эрэгионском диалекте правильно так, как написано.
    Вот и вы рассуждаете о синдарине не вдаваясь во внутреннюю историю в пределах мира описанного(выдуманного) JRRT. На синдарин внутри мира не могут влиять шотландские, ирландские и прочие японские языки, на синдарин влияют кхуздул и вестрон, синдарин не вышел из шотландского или ирландского, синдарин вышел из квэнья.

  • http://mozgorilla.com

  •