КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА

материалы к государственному экзамену

ВОПРОСЫ

 

  1. Технологии компьютерного лингвистического моделирования (математические модели текста, квантитативные модели текста, модели лингвистической разметки, Большие языковые модели ++)

  2. Квантитативные методы лингвистических исследований (квантитативные модели, квантитативная лингвистика, приложения квантитативных моделей, частотные словари, словари-индексы, машинные фонды лексики, конкордансы, квантитативные закономерности, ограниченность квантитативных методов исследования языка).

  3. Лингвистические корпусы (понятие, приложения и ограничения лингвистических корпусов, корпусная лингвистика, история корпусного моделирования, корпусный подход в сравнении с хомскианской лингвистикой, разметка языковых корпусов, лингвистические исследования на базе корпусов, белорусские корпусные исследования)

  4. Natural Language Processing (Понятие автоматической обработки текста,  статистические методы NLP NLP-метаразметка, символьное моделирование + Большие языковые модели)

  5. Neural-based machine translation (основные технологии машинного перевода, Neural-based machine translation, системы перевода на основе NBMT в Google и Microsoft, Google Neural Machine Translation, проект OpenNMT, возможности NBMT на основе Tensor Processing Unit и FPGА + LLM в переводе)

  6. Natural Language Understanding (понимание в Computer Science, Дефиниция NLU, Бенчмаркинг, GLUE, SuperGLUE, NLU в стеке технологий NLP, NLU как AI-полная задача, области применения NLU, лингвистические проблемы NLU, достижения NLU, современные модели и технологии NLU)

  7. Natural Language Generation (синтез речи, синтезатор речи, голосовой движок, Модели (алгоритмы) синтеза речи : конкатенативный (компилятивный) синтез; параметрический синтез; формантный синтез (по правилам); предметно-ориентированный синтез. Синтез речи с помощью нейронной сети. Модель синтеза речи с помощью нейронной сети. Языковая инфраструктура синтеза речи + Большие языковые модели )

  8. Языковые модели (лингвистические понимания LM, математическая дефиниция LM, дефиниция LM, N-граммные языковые модели, LM как языковая машина, нейросетевые языковые модели, представление данных в нейростеевых LM, нейросетевые технологии LM, оценка нейросетевых языковых моделей, Benchmarking, Perplexity)

  9. Большие языковые модели   (языковая модель, дефиниция Large Language Mode (LLM), технологические предпосылки LLM, LLM и BigData, современные LLM, приминение LLM, достижения LLM, ограничения LLM, проблемы LLM, LLM-cервисы, Prompt engineering, LLM в образовании, гуманитарное значение LLM)

  10. Модели лингвистической разметки (стандарты представления языковых ресурсов, лингвистическая разметка языковых корпусов, проект TEI, TEI Lite, автоматическая лингвистическая разметка корпусных данных )

 

ПРАКТИЧЕСКИЕ ЗАДАНИЯ

Для выполнения практических заданий НУЖНО взять свои ноутбуки

Вы получаете одно из заданий (приложение может быть у вас на ноутбуке)

  • костомизируете его (редактируете код с целью адаптации под свои персональные данные),

  • демонстрируете Комиссии адаптированную версию (везде должны быть ваши Фамилия Имя Отчество: в тексте, заголовках и т.п.),

  • объясняете работу кода,

  • описываете лингводидактический потенциал приложения (в компетентностном, коммуникативном и персонализированном подходах).

 

  1. Кастомизировать для обработки персонализованного контента модель нативного браузерного веб-приложения Semantic Modeler, объяснить его код и описать лингводидактический потенциал (в компетентностном, коммуникативном и персонализированном подходах)

  2. Кастомизировать для обработки персонализованного контента модель нативного браузерного веб-приложения Sentiment Analysis, объяснить его код и описать лингводидактический потенциал (в компетентностном, коммуникативном и персонализированном подходах)

  3. Кастомизировать для обработки персонализованного контента модель нативного браузерного веб-приложения Concordance construction, объяснить его код и описать лингводидактический потенциал (в компетентностном, коммуникативном и персонализированном подходах)

  4. Кастомизировать для обработки персонализованного контента модель нативного браузерного веб-приложения Named Entity Recognition, объяснить его код и описать лингводидактический потенциал (в компетентностном, коммуникативном и персонализированном подходах)

  5. Кастомизировать для обработки персонализованного контента модель нативного браузерного веб-приложения Punctuation analysis, объяснить его код и описать лингводидактический потенциал (в компетентностном, коммуникативном и персонализированном подходах)

  6. Кастомизировать для обработки персонализованного контента модель нативного браузерного веб-приложения Word Cloud Generator, объяснить его код и описать лингводидактический потенциал (в компетентностном, коммуникативном и персонализированном подходах)

  7. Кастомизировать для обработки персонализованного контента модель нативного браузерного веб-приложения Synonym Replacer, объяснить его код и описать лингводидактический потенциал (в компетентностном, коммуникативном и персонализированном подходах)

  8. Кастомизировать для обработки персонализованного контента модель нативного браузерного веб-приложения Dialogue bot, объяснить его код и описать лингводидактический потенциал (в компетентностном, коммуникативном и персонализированном подходах)

  9. Кастомизировать для обработки персонализованного контента модель нативного браузерного веб-приложения Text statistics, объяснить его код и описать лингводидактический потенциал (в компетентностном, коммуникативном и персонализированном подходах)

  10. Кастомизировать для обработки персонализованного контента модель нативного браузерного веб-приложения Interactive dictation, объяснить его код и описать лингводидактический потенциал (в компетентностном, коммуникативном и персонализированном подходах)

 

 

Учреждение образования
"Бр
естский государственный университет имени А.С. Пушкина"
20
25