ОСНОВЫ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ

материалы к государственному экзамену

ПРИМЕРНЫЕ ВОПРОСЫ

  1. Понятие компьютерной лингвистики
    Термин «компьютерная лингвистика». Подходы к определению компьютерной лингвистики через объект, предмет, задачи, средства и методы. Математическая лингвистика. Вычислительная лингвистика. Приложения компьютерной лингвистики.

  2. Логико-математические и языковедческие основы компьютерной лингвистики
    Логические и лингвистические проблемы современной математики. Формализмы. Языки формальной логики. Лингвистические проблемы компьютерных наук. Эволюция научного понимания языка и задач его изучения. Научные метафоры языка. Формальные грамматики и семантики.

  3. Квантитативная лингвистика
    П
    онятие квантитативных методов. Модель текста bag-of-words. Частотные словари, словари-индексы, машинные фонды лексики. Частотный словарь как векторная модель текста, латентно-семантический анализ, нормализация и стемминг. Конкордансы. Регулярные выражения. Характеристики частотных словарей и индексы покрытия текста. Квантитативные закономерности. Ограниченность квантитативных методов исследования языка и их следствия)

  4. Корпусная лингвистика
    Понятие "корпуса текстов". Цель и задачи корпусной лингвистики. Виды и типы  корпусов. Приложения и ограничения лингвистических корпусов. Корпусный подход в сравнении с хомскианской лингвистикой. Средства и методы разметки корпусной информации. Лингвистические исследования на базе корпусов. Поисковые технологии в текстовых корпусах. Использования корпусов в преподавании языков.

  5. Компьютерная лексикография и терминография
    Предмет, задачи и особенности компьютерной лексикографии, лексикографическое противоречие. Лексикографическая концепция электронного словаря.  Инструменты воплощения лексикографической концепции. Сетевые словарные сервисы. Предмет и приложения компьютерного терминоведения. Терминологические базы данных. Управление терминологией. Автоматическое извлечение терминологии. Компьютерные тезаурусы. Синсеты. Информационно-поисковые тезаурусы.

  6. Компьютерный перевод
    Понятие компьютерного перевода. Автоматический и автоматизированный перевод. CAT. Технологии компьютерного перевода их характеристика и примеры реализации. Оценка эффективности технологии перевода. Оценка качества машинного перевода. Технологии и системы Тranslation Мemory. Интернационализация и локализация: понятие, инструментарий, характеристики специализированных систем.

  7. Компьютерное распознавание и синтез устной речи
    Технологии распознавания устной речи по образцу и на основе выделения лексических элементов. Методы выделения из речи лексических элементов. Лингвистические проблемы распознавания устной речи. Технологии и модели синтеза устной речи. Языковая инфраструктура синтеза и распознавания речи. Голосовые платформы. VoiceXML и Speech Application Language.

  8. Формальные языки и грамматики
    Математическая модель языка. Коммуникативная абстракция языка Формальный язык как множество и как алгебраическая система. Характеристики формальных языков. Лексика, грамматика и семантика формальных языков. Иерархия Хомского. Замкнутость и распознавание формальных языков. Формальные грамматики как математические модели. Свойства и модели формальных грамматик, синтаксические теории. Формальная модель порождающей грамматики (терминалы, нетерминалы, выводы).

  9. Лингвистическое обеспечение искусственного интеллекта
    Понятие искусственного интеллекта. Искусственный интеллект как лингвистическая проблема. Автоматическая обработка текста в системах искусственного интеллекта. Автогенерация связного текста. Методы и технологии поддержания диалога на естественных языках. Нейронные сети  и машинное обучение в обработке текстовой информации.

  10. Метатекстовая разметка и лингвистическое аннотирование
    Метаразметка. Языки разметки. Метаязык. XML и его приложения в области работы с электронным текстом. Лингвистическая разметка. Лингвистическая аннотация и метаданные. Text Encoding Initiative. Семантическая разметка.
    Микроформатная лингвистическая разметка.

 

ПРИМЕРНЫЕ ПРАКТИЧЕСКИЕ ЗАДАНИЯ
 

  1. Изготовление иллюстрированного переводного словаря в ReWord (см. здесь)

  2. Изготовление проверочного интерактивного двуязычного (русско-английского, русско-немецкого) диктанта (см. здесь задания 4-10)

  3. Изготовление проверочного двуязычного (русско-английского или русско-немецкого) теста учебных достижений на установление соответствия между элементами двух множеств (см. здесь задания 2-7)

  4. Изготовление проверочного двуязычного (русско-английского или русско-немецкого) теста учебных достижений с проверочными заданиями закрытой формы (выбор ответа из перечня вариантов. см. здесь задания 3-5 )

  5. Изготовление проверочного двуязычного (русско-английского или русско-немецкого) теста учебных достижений с проверочными заданиями открытой формы (ввод собственного ответа в поле формы см. здесь задания 6-8)

  6. Изготовление словарного двуязычного (русско-английского или русско-немецкого) диалогового бота (см. здесь Chat2004)

  7. Изготовление двуязычного материала с контекстным переводом на странице (см. здесь задание 7)

  8. Обучение нейронной сети распознаванию рукописных символов алфавита  (см. здесь задания 6-11)

  9. Построение и анализ частотного словаря и конкорданса в AntConc  (см. здесь задания 9-16)

  10. Произвести в JFLAP парсинг предложенного текста на основе формальной грамматики с получением дерева синтаксического разбора деривационной таблицы  (см. здесь задания 5-9)

 

 

Учреждение образования
"Бр
естский государственный университет имени А.С. Пушкина"
201
9