ПЕДАГОГИЧЕСКАЯ СИСТЕМА КУРСА

«КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ»

 

 

 

 

 

 

 

 

 

Проблемное поле курса

 

Компьютерное (вычислительное) моделирование языковых феноменов:

  • графематических и фонетических конструкций,

  • устной речи,

  • письменного текста,

  • диалогов,

  • синтаксических конструкций,

  • компьютерных языков и др.

 

 

Цель и задачи курса

 

 

Цель преподавания:

  • формирование  лингвистических и технологических компетенций в области компьютерного моделирования языковых феноменов и языков.


Задачи:

  • овладение системой знаний о научных основах компьютерного моделирования, его предмете, задачах, методах и путях их решения, инструментарии, лингвистических и педагогических приложениях;

  • расширение и закрепление  опыта в области постановки и решения профильных задач на основе использования современных компьютерных моделей, навыков работы с современными системами и сервисами компьютерного моделирования языковых феноменов;

  • освоение  основных методов и средств компьютерного моделирования, получение и закрепление навыков комплексного использования средств вычислительной техники в решении задач автоматизации обработки языковой информации;

  • приобретение начального опыта научного анализа информационной составляющей текстовых сообщений и поиска путей их решения на основе использования систем и средств компьютерного моделирования.

 

 

 

 

Особенности работы в ЭОС

 

Электронная образовательная среда (ЭОС) представляет собой системно организованную совокупность сетевых коммуникационных технологий, программного и организационного обеспечения, которая позволяет на основе интеграции электронных пособий по конкретным учебным курсам с элементами дистанционного обучения эффективно удовлетворить образовательные потребности студентов в контексте решения педагогических задач.

ЭОС реализуется на аппаратном обеспечении учебного компьютерного класса, включенного в LAN университета, подключенного к Интернету по широкополосной линии, имеющего возможность использования современных интернет-сервисов.

ЭОС включает: учебный материал, аппарат организации усвоения по всем темам курса, средства и технологии сетевых коммуникаций, позволяющие реализовать дидактически и организационно эффективную систему выполнения учебных поручений и контроля их успеваемости; систему учебных сетевых коммуникаций для решения программных задач преподаваемого курса.

ЭОС предполагает реализацию инвариантного и вариативного компонентов содержательного, организационного, программного планов. Посредством модульной открытой структуры ЭОС, обеспечивается простота обновления содержательного материала, оперативный учет особенностей протекания процесса обучения, а также изменений в планах и программах учебных дисциплин.

Ядро ЭОС представляет собой учебно-методический комплекс в виде Web-сайта, размещенного на сервере учебного компьютерного класса. Доступ к нему возможен с каждого рабочего места студента по локальной компьютерной сети. Сайт создан с использованием HTML, CSS, Flash, JavaScript, Java.

Учебный материал представляет собой развернутый иллюстрированный гипертекст.

 

 

 

 

Аппарат усвоения ЭОС

Аппарат усвоения и ориентировки ЭОС включает:

  • практические задания;

  • перечень практических умений;

  • проектные задания;

  • материалы для антаподозиса;

  • лексику для учебного терминологического словаря;

  • учебные, контрольные и диагностические тесты.

Студенты имеют возможность работать с пособием в домашних условиях, располагают точной копией учебного материала, находящегося на серверах учебных лабораторий.

Компьютерные программы (не требующие инсталляции) встроены прямо в электронное пособие. Вместе с тем пособие является открытой системой для внешних источников информации и программных средств.

 

 

 

Исследовательские и образовательные центры
компьютерного моделирования

Ведущие исследовательские и образовательные центры лингвистического компьютерного моделирования:

 

 

Основная литература

  1. Боев В.Д., Сыпченко Р.П. Компьютерное моделирование Издательство: М.: НОУ "Интуит", 2019 – 525 с.

  2. Николаев И.С., Митренина О.В., Ландо Т.М.  Прикладная и компьютерная лингвистика М.: Ленанд, 2016. – 316 с.

  3. Майер Р. В. Компьютерное моделирование: учебно-методическое пособие для студентов педагогических вузов [Электронное учебное издание на компакт-диске]. – Глазов: Глазов. гос. пед. ин-т, 2015. – 24,3 Мб.

  4. Исаев Г.Н. Моделирование информационных ресурсов: теория и решение задач: учебное пособие / Г.Н. Исаев. - М.: Альфа-М: ИНФРА-М, 2010. - 224 с.

  5. Боярский, К.К. Введение в компьютерную лингвистику: учебное пособие. – СПб: НИУ ИТМО, 2013. – 72 с.

 

 

Дополнительная литература
 

  1. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика : учеб. пособие / Большакова Е.И., Клышинский Э.С., Ландэ Д.В., Носков А.А., Пескова О.В., Ягунова Е.В. – М.: МИЭМ, 2011. – 272 с.

  2. Богуславская, В.В. Моделирование текста : лингвосоциокультурная концепция : Анализ журналистских текстов / В.В. Богуславская . – Изд. 3-е . – М. : Изд-во ЛКИ, 2011 . – 276 с.

  3. Эпштейн, М.Н. Проективный словарь гуманитарных наук / Михаил Наумович Эпштейн. – М.: НЛО, 2017. – 616 с.

  4. Майер Р.В. Основы компьютерного моделирования: Учебное пособие. – Глазов: ГГПИ, 2005. – 25 с. [Электронный ресурс] – Режим доступа: http://ggpi.org/metod/kaf_d_ph/komp_model/kom-mod.html#0

  5. Лузина Л.И. Компьютерное моделирование: Учебное пособие. − Томск: Томский межвузовский центр дистанционного образования, 2001. − 105 с.

  6. Пентус, А.Е., Пентус  М.Р. Теория  формальных  языков: учебное  пособие.  – М.: МГУ, 2004. – 80 с.

  7. Лапшин В.А. Онтологии в компьютерных системах. М., Научный Мир, 2017. – 315с.

  8. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика : учеб. пособие / Большакова Е.И. [и др.]. – М.: МИЭМ, 2011. – 272 с.

  9. Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 26–30 мая 2010 г.). Вып. 9 (16). – М.: Изд-во РГГУ, 2010.

  10. Лингвистика для всех. Летние лингвистические школы 2005 и 2006 / Ред.–сост. Е.В. Муравенко, О.Ю. Шеманаева. – М.: МЦНМО, 2008. – 440 с.

  11. Зализняк А.А. Из заметок о любительской лингвистике. – М.: Русский Миръ, 2008. – 240 с.

  12. Волкова, И.А. Введение в компьютерную лингвистику. Практические аспекты создания лингвистических процессоров: учебное пособие. – М., 2006. – 43 с.

  13. Апресян, Ю.Д. Лингвистический процессор для сложных информационных систем / Ю.Д. Апресян [и др.]. – М.: Наука, 1992. – 256 с.

  14. Мельчук, И.А Опыт теории лингвистический моделей «Смысл Текст». – М.: Школа «Языки русской культуры», 1999. – 346 с.

  15. Макеева Л.Б. Язвк, онтология и реализм. – М. ВШЭ, 2011. – 312с.

 

 

 

Вспомогательные материалы

  • Карпов О.Н. Технология построения устройств распознавания речи. – Днепропетровск., 2001. – 184 с.

  • Марчук Ю.Н. Компьютерная лингвистика: учебное пособие, М., АСТ Восток-Запад, 2007, 317с.

  • Компьютерная лингвистика: научное направление и учебная дисциплина [Текст]: сборник научных статей. Вып. 1 / В. И. Коваль (ответств. ред.) [и др.]; М-во образования РБ, ГГУ им. Ф. Скорины. – Гомель: ГГУ им. Ф. Скорины, 2010. – 236 с.

  • Кривнова О.Ф. Речевые корпуса на новом технологическом витке // Речевые технологии. 2008. № 2. С. 13–24.

  • Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог» (Бекасово, 26–30 мая 2010 г.). Вып. 9 (16). — М.: Изд-во РГГУ, 2010.

  • Ронжин А.Л. Особенности автоматического распознавания разговорной русской речи //Труды первого междисциплинарного семинара «Анализ разговорной русской речи», (АРЗ-2007).- СПб.: ГУАП, 2007.

  • Белоногов, Г.Г. Компьютерная лингвистика и перспективные информационные технологии. – М.: Русский мир, 2004. – 248 с.

 

 

 

 

Рекомендуемые интернет-ресурсы

 

  1. Wolfram|Alpha — computational knowledge engine)
    https://www.wolframalpha.com/

  2. Русская корпусная грамматика
    http://rusgram.ru/

  3. Верные слова (интерактивный онлайн-учебник русского языка)
    https://vsrussian.com/

  4. Национальный корпус русского языка
    http://www.ruscorpora.ru/ 

  5. OpenCorpora: открытый корпус русского языка
    www.opencorpora.org  

  6. Corpus Albaruthenicum
    http://grid.bntu.by/corpus/

  7. Link Grammar for Russian - Грамматика связей для русского языка - Разбор предложения
    http://www.sz.ru/parser/

  8. Система лингвистического поиска для русского, английского и немецкого языков, доступная с сайта
    http://aot.ru/

  9. Онлайновая лингвистическая лаборатория Microsoft
    http://labs.microsofttranslator.com/

  10. Проект «Сеть словесных ассоциаций»
    http://wordassociations.ru/

  11. Машинный фонд Института русского языка им. В. В. Виноградова РАН

  12. Упсальский и Тюбингенский корпуса (доступны для скачивания)

  13. Генеральный интернет-корпус русского языка (доступен для поиска после регистрации, корпус со снятой омонимией — для скачивания)

  14. Тестовый корпус с параллельной синтаксической разметкой (доступен для онлайн-поиска)

  15. RUS-Treebank: корпус с автоматической разметкой синтаксических зависимостей (доступен для онлайн-поиска)

  16. Русский учебный корпус: образцы устной и письменной речи изучающих русский язык как иностранный и так называемых эритажных говорящих (доступен для онлайн-поиска)

  17. Корпус русских учебных (академических) текстов (КРУТ): коллекция текстов на русском языке, написанных студентами разных вузов (доступен для онлайн-поиска)

  18. Белорусский N-корпус (доступен для онлайн-поиска)

  19. Белорусский библейский корпус (доступен для онлайн-поиска)

  20. Экспериментальный корпус белорусского языка (доступен для скачивания)

  21. Corpus Albaruthenicum — корпус научных белорусских текстов (доступен для онлайн-поиска)

  22. Национальный корпус польского языка (доступен для онлайн-поиска)

  23. Британский национальный корпус (BNC) (тестовая версия доступна для онлайн-поиска, полная версия платная)

  24. Немецкий справочный корпус (DeReKo) (доступен для онлайн-поиска через программу-клиент COSMAS II, требуется регистрация)

  25. Банк данных разговорного немецкого (DGD) (требуется регистрация)

  26. Universal Dependencies: размеченные в едином формате синтаксические корпуса 47 языков

  27. WebCorp: Инструмент для построения конкордансов на материале Интернета для разных языков (Web-as-Corpus)

  28. Лингвистический энциклопедический словарь

  29. GPT-3 (модель для генерации текстов от OpenAI)

  30. Датасет Schema-Guided Dialogue (SGD,  опубликован Googl) для обучения виртуальных ассистентов — крупнейший из находящихся в открытом доступе набор диалогов: 18 000 проблемно-ориентированных размеченных диалогов между людьми и виртуальным ассистентом по 17 темам (СМИ, банки, мероприятия, путешествия, погода ++). Подробно в блоге Google. Исследовательская работа на arXiv, исходный код на GitHub.

  31. Датасет Dinner Party Corpus (DiPCo, открыт Amazon), для решения проблемы «эффекта вечеринки» — восприятия и распознавания речи сразу нескольких спикеров в шумном месте (читать)

  32. КОРПУСА ЗВУЧАЩЕЙ РЕЧИ

  33. http://www.dialog-21.ru/  (сайт международной конференции по компьютерной лингвистике и интеллектуальным технологиям

 

 

 

ДЛЯ УМНЫХ

 

kmp