ВОПРОСЫ ПО КУРСУ
ОСНОВЫ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ

 

 

ЭКЗАМЕНАЦИОННАЯ ОТМЕТКА - АВТОМАТОМ

1, 2, 3 - невыполненные лабораторные работы (в зависимости от числа задолженностей) или отказ от ответа

4 - выполнение всех лабораторных работ

5 - своевременное (регулярное и завершенное к последнему занятию) выполнение лабораторных работ

6 - своевременное выполнение всех лабораторных работ + конспект ответов на экз. вопросы

7 - своевременное выполнение всех лабораторных работ + полный, аккуратный и грамотный конспект

8 - своевременное выполнение лабораторных работ + конспект + персональный проект

9 - своевременное выполнение лабораторных работ + конспект + успешный персональный проект

10 - за победу в GIMPS

 

 

ПРЕДВАРИТЕЛЬНАЯ ВЕРСИЯ

 

  1. Понятие компьютерной лингвистики (термин «компьютерная лингвистика». Подходы к определению компьютерной лингвистики через объект, предмет, задачи, средства и методы. Математическая лингвистика. Вычислительная лингвистика. Приложения компьютерной лингвистики. Компьютерная лингвистика в современном языковом образовании).

  2. Языковедческие основы компьютерной лингвистики (эволюция научного понимания языка и задач его изучения (В. Фон Гумбольдт, Август Шлейхер, Бодуэн де Куртенэ, Ф. де Соссюр). Научные метафоры языка. Лингвистический поворот. Л. Витгенштейн и структурная лингвистика. Генеративные грамматики Н. Хомского, теория «Смысл-Текст». Формальная семантика Ричарда Монтегю).

  3. Логико-математические основы компьютерной лингвистики (современная математика в периодизации А. Колмогорова. Логические и лингвистические проблемы современной математики. Лингвистические вычисления. Проблема вычислимости и сложности. Математическая лингвистика. Компьютер как языковая машина. Лингвистические проблемы компьютерных наук. Идеи А. Тьюринга, А. Чёрча, А.Н. Колмогорова, А.А. Маркова).

  4. Формализм компьютерной лингвистики (Формализация в математике, логике и лингвистике. Искусственные языки. Языки формальной логики. Формальные языки и грамматики. Исчисления, предикаты, нечетка логика, математические выражения грамматик Хомского).

  5. Компьютерный лингвистический анализ (графематический, фонетический, морфологический, синтаксический, семантический, фоносемантический. Semantic Web. Атрибуция текста).

  6. Лингвистическое обеспечение искусственного интеллекта (Понятие искусственного интеллекта. Автоматическая обработка текста в системах искусственного интеллекта. Автогенерация связного текста.  Методы поддержания диалога на естественных языках).

  7. Компьютерные языки (искусственные и компьютерные языки, типы компьютерных языков, Universal Networking Language, языки поисковых запросов, языки разметки, языки программирования, примеры и тенденции развития языков программирования высокого уровня, стили программирования, тенденции развития программирования).

  8. Квантитативная лингвистика (понятие квантитативных методов. Частотные словари, словари-индексы, машинные фонды лексики. Конкордансы. Регулярные выражения. Характеристики частотных словарей и индексы покрытия текста. Квантитативные закономерности. Ограниченность квантитативных методов исследования языка и их следствия).

  9. Математические модели текста (метод математического моделирования, модель текста bag-of-words, частотная модель текста, веторная модель текста, частотный словарь как векторная модель текста, латентно-семантический анализ, нормализация и стемминг).

  10. Корпусная лингвистика (понятие "корпуса текстов", цель и задачи корпусной лингвистики, Брауновский корпус,  НКРЯ, OpenCorpora, ГИКРЯ, белорусские текстовые корпусы, двуязычные корпусы, создатели текстовых корпусов).

  11. Компьютерный инструментарий лингвистических корпусов (средства и методы разметки корпусной информации, поисковые технологии в текстовых корпусах, компьютерный инструментарий мультимедийных корпусов, Программы для работы с корпусом).

  12. Текстовые корпусы в науке и образовании (Корпусные исследования в лингвистике. Методы извлечения информации из корпуса и ее типы. Конкорданс. Возможности использования текстовых корпусов в преподавании родного и иностранных языков).

  13. Метатекстовая разметка (Метаразметка. Языки разметки. Метаязык. XML и его приложения в области работы с электронным текстом. Лингвистическая разметка (аннотирование).  Лингвистическая аннотация и метаданные. TEI)

  14. Технологии информационного поиска (понятие, типы и виды информационного поиска, поиск в электронном документе и в Интернете, языки поисковых запросов, поисковые службы, поисковая оптимизация, тенденции и перспективы развития поисковых сервисов).

  15. Языки поисковых запросов (Языки запросов. Регулярные выражения в языках поисковых запросов. XPath, XQuery, SQL. Языки запросов поисковых систем, их возможности. Структура языка запросов. Языковые инструменты поисковых систем)

  16. Регулярные выражения (Иерархия Хомского. Регулярные грамматики. Регулярные выражения. Структура регулярных выражений. Regex (regular expressions). Общая схема Regex. Сетевой инструментарий по Regex. Регулярные выражения в Microsoft Word)

  17. Лингвистическое программное обеспечение (понятие программного обеспечения, программы для работы с вербальной информацией, возможности анализа и обработки текста в текстовом и табличном процессоре, сетевые сервисы лингвистического анализа и обработки текста).

  18. Технологии эффективного чтения (характеристики чтения с экрана, типы и характеристики электронных книг, e-book, e-reader, e-text, технологии Evernote Clearly и Rapid serial visual presentation)

  19. Технологии оптического распознавания (понятие и области применения OCR, алгоритмы оптического распознавания, характеристики и программы OCR, понятие Intelligent Character Recognition, системы распознавания рукописного текста).

  20. Технологии распознавания устной речи аспознавание элементов речи по образцу  и на основе выделения лексических элементов, методы выделения из речи лексических элементов, лингвистические проблемы распознавания устной речи).

  21. Технологии синтеза устной речиодель компилятивного синтеза устной речи., формантно-голосовая модель синтеза устной речи, синтез устной речи с помощью нейронной сети, лингвистические проблемы синтеза устной речи).

  22. Языковая инфраструктура синтеза и распознавания речи (CLI, голосовые платформы, Microsoft Speech Platform, Speech Recognition Grammar Specification, Speech Synthesis Markup Language, Speech Recognition Grammar Specification, теги параметров речи).

  23. VoiceXML и Speech Application Language (достоинства и ограниченря VoiceXML и Speech Application Language Tags, назначение тегов VoiceXML, структура VXML-документа VXML, VXML.RU).

  24. Технологии компьютерной лексикографии (предмет лексикографии, задачи и особенности компьютерной лексикографии, лексикографическое противоречие)

  25. Компьютерное терминоведение (понятия терминологии, терминоведения, проблемы и приложения компьютерного терминоведения)

  26. Понятие термина (дефиниция, определяющие свойства терминов, термин в системе понятий, термин и правила языка, создание терминов, термин в логике (терм), больший и меньший термины).

  27. Понятие словаря (основные дефиниции словаря, лексикографическое определения понятия "словарь", объекты описания лингвистических словарей, основные структурные элементы проектирования словаря)

  28. Структура словаря и словарной статьи (композиция словаря, основные компонеты мега-, макро и   микроструктуры словаря, дефиниция словарной статьи и способы организации ее основных структурных элементов)

  29. Лексикографическая концепция (дефиниция лексикографической концепции, основы создания лексикографической концепции, пример лексикографической концепции, инструменты воплощения лексикографической концепции, лексикографическая концепция Викисловаря, словарность, Викисловарь)

  30. Электронные переводные словари (понятие электронного словаря, популярные типы электронных словарей, их пользовательские характеристики, сетевые словарные сервисы, Lingvo Live).

  31. Терминологические базы данных (понятие базы данных, структура базы данных, termbases, метаданные в termbases, типы терминологических баз данных по целевому и инструментальному назначению, примеры сетевых терминологических баз данных, создание терминологических баз данных).

  32. Лингвистические корпусы в терминоведении (понятие лингвистического корпуса, примеры корпусов, параллельный текст, параллельный корпус, проблемный корпус, единицы хранения в корпусах, корпусы в терминоведческих исследованиях, способы терминографического анализа корпуса параллельных текстов)

  33. Управление терминологией (понятие Terminology Management, структура управления терминологией, области применения управления терминологией, Terminology Management System, системы и сетевые сервисы управления терминологией, автоматический поиск в сетевых терминологических базах)

  34. Автоматическое извлечение терминологии (понятие и этапы извлечения терминологии, системы автоматического извлечения терминологии, примеры систем, функции и возможности PROMT Term).

  35. Тезаурусы (дефиниция, тезаурусы в лингвистике, области применения тезаурусов, примеры тезаурусов, тезаурус WordNet, синсеты, информационно-поисковые тезаурусы, цели разработки ИПТ, информационно-поисковые языки, дескрипторы, ключевые слова, правила включения терминов в тезаурус. Онтологии).

  36. Компьютерный перевод (понятие перевода, виды переводов, тотальный перевод.  Компьютерная обработка текста как перевод. Компьютерный межсемиотический перевод. Компьютерный межязыковой перевод. Компьютерная локализация. Перевод с современной глобальной информационной среде.

  37. История компьютерного перевода (основные события, периоды и даты, современное состояние, проблемы и перспективы)

  38. Cредства автоматизированного перевода (machine translation, machine-assisted translation, CAT, информационные технологии для перевода, перевод для ИТ, лингвистические информационные технологии)

  39. Интернационализация и локализация (понятие интернационализации и локализации, основные элементы и этапы  локализации, инструментарий локализации, шаблонные переводчики, примеры и характеристики специализированных систем локализации)

  40. Технологии компьютерного перевода (технологии Rule-based (Interlingua, Transfer consecutive, Transfer hierarchica) и Statistical-based, Hybrid-based, их характеристика и примеры реализации, проекты UNL, DLT, NLC, оценка эффективности технологии перевода)

  41. Системы и сервисы компьютерного перевода (понятие системы компьютерного перевода, основные параметры систем MT, сравнительные характеристики систем от ведущих разработчиков, система PROMT,  система Belazar, особенности и примеры сетевых переводческих сервисов)

  42. Тranslation Мemory (понятие, основы технологии, эффективность,  востребованность, стандарты, разработчики Translation Memory и их системы)

  43. Нейронные сети (модели компьютерной обработки информации, искусственные нейроны и нейронные сети, перцептрон, нейрокомпьютеры, области применения и правила использования нейронных сетей, ограничения нейронных сетей)

  44. Машинное обучение (Machine Learning, обучение по прецедентам, алгоритмы обучения нейронных сетей, метод обратного распространения ошибки, глубокое обучение, задачи и приложения машинного обучения, машинное обучение в обработке текста, машинное обучение на векторных моделях)

 

 

Учреждение образования

"Брестский государственный университет имени А.С. Пушкина"

2016

 

 

kmp