ВОПРОСЫ ПО КУРСУ

 

 

  1. Понятие компьютерной лингвистики (термин «компьютерная лингвистика». Подходы к определению компьютерной лингвистики через объект, предмет, задачи, средства и методы. Математическая лингвистика. Вычислительная лингвистика. Приложения компьютерной лингвистики. Компьютерная лингвистика в современном языковом образовании).

  2. Языковедческие основы компьютерной лингвистики (эволюция научного понимания языка и задач его изучения (В. Фон Гумбольдт, Август Шлейхер, Бодуэн де Куртенэ, Ф. де Соссюр). Научные метафоры языка. Лингвистический поворот. Л. Витгенштейн и структурная лингвистика. Генеративные грамматики Н. Хомского, теория «Смысл-Текст». Формальная семантика Ричарда Монтегю).

  3. Логико-математические основы компьютерной лингвистики (современная математика в периодизации А. Колмогорова. Логические и лингвистические проблемы современной математики. Лингвистические вычисления. Проблема вычислимости и сложности. Математическая лингвистика. Компьютер как языковая машина. Лингвистические проблемы компьютерных наук. Идеи А. Тьюринга, А. Чёрча, А.Н. Колмогорова, А.А. Маркова).

  4. Компьютерный лингвистический анализ (графематический, фонетический, морфологический, синтаксический, семантический, фоносемантический. Semantic Web. Атрибуция текста).

  5. Автогенерация связного текстаМетоды поддержания диалога на естественных языках.

  6. Компьютерные языки (искусственные и компьютерные языки, типы компьютерных языков, Universal Networking Language, языки поисковых запросов, языки разметки, языки программирования, примеры и тенденции развития языков программирования высокого уровня, стили программирования, тенденции развития программирования).

  7. Квантитативная лингвистика (понятие квантитативных методов. Частотные словари, словари-индексы, машинные фонды лексики. Конкордансы. Регулярные выражения. Характеристики частотных словарей и индексы покрытия текста. Квантитативные закономерности. Ограниченность квантитативных методов исследования языка и их следствия).

  8. Математические модели текста (метод математического моделирования, модель текста bag-of-words, частотная модель текста, веторная модель текста, частотный словарь как векторная модель текста, латентно-семантический анализ, нормализация и стемминг).

  9. Корпусная лингвистика (понятие "корпуса текстов", цель и задачи корпусной лингвистики, Брауновский корпус,  НКРЯ, OpenCorpora, ГИКРЯ, белорусские текстовые корпусы, двуязычные корпусы, создатели текстовых корпусов).

  10. Компьютерный инструментарий лингвистических корпусов (средства и методы разметки корпусной информации, поисковые технологии в текстовых корпусах, компьютерный инструментарий мультимедийных корпусов, Программы для работы с корпусом).

  11. Текстовые корпусы в науке и образовании (Корпусные исследования в лингвистике. Методы извлечения информации из корпуса и ее типы. Конкорданс. Возможности использования текстовых корпусов в преподавании родного и иностранных языков).

  12. Стандарты лингвистической разметки. TEI. (Метаразметка. Языки разметки. Метаязык. XML и его приложения в области работы с электронным текстом. Лингвистическая разметка (аннотирование).  Лингвистическая аннотация и метаданные. TEI)

  13. Языки поисковых запросов (Языки запросов. Регулярные выражения в языках поисковых запросов. XPath, XQuery, SQL. Языки запросов поисковых систем, их возможности. Структура языка запросов. Языковые инструменты поисковых систем)

  14. Регулярные выражения (Иерархия Хомского. Регулярные грамматики. Регулярные выражения. Структура регулярных выражений. Regex (regular expressions). Общая схема Regex. Сетевой инструментарий по Regex. Регулярные выражения в Microsoft Word)

  15. Технологии оптического распознавания (понятие и области применения OCR, алгоритмы оптического распознавания, характеристики и программы OCR, понятие Intelligent Character Recognition, системы распознавания рукописного текста).

  16. Языковая инфраструктура синтеза и распознавания речи (CLI, голосовые платформы, Microsoft Speech Platform, Speech Recognition Grammar Specification, Speech Synthesis Markup Language, Speech Recognition Grammar Specification, теги параметров речи).

  17. VoiceXML и Speech Application Language (достоинства и ограниченря VoiceXML и Speech Application Language Tags, назначение тегов VoiceXML, структура VXML-документа VXML, VXML.RU).

  18. Технологии компьютерной лексикографии (предмет лексикографии, задачи и особенности компьютерной лексикографии, лексикографическое противоречие)

  19. Компьютерное терминоведение (понятия терминологии, терминоведения, проблемы и приложения компьютерного терминоведения)

  20. Понятие термина (дефиниция, определяющие свойства терминов, термин в системе понятий, термин и правила языка, создание терминов, термин в логике (терм), больший и меньший термины).

  21. Понятие словаря (основные дефиниции словаря, лексикографическое определения понятия "словарь", объекты описания лингвистических словарей, основные структурные элементы проектирования словаря)

  22. Структура словаря и словарной статьи (композиция словаря, основные компонеты мега-, макро и   микроструктуры словаря, дефиниция словарной статьи и способы организации ее основных структурных элементов)

  23. Лексикографическая концепция (дефиниция лексикографической концепции, основы создания лексикографической концепции, пример лексикографической концепции, инструменты воплощения лексикографической концепции, лексикографическая концепция Викисловаря, словарность, Викисловарь)

  24. Электронные переводные словари (понятие электронного словаря, популярные типы электронных словарей, их пользовательские характеристики, сетевые словарные сервисы, Lingvo Live).

  25. Терминологические базы данных (понятие базы данных, структура базы данных, termbases, метаданные в termbases, типы терминологических баз данных по целевому и инструментальному назначению, примеры сетевых терминологических баз данных, создание терминологических баз данных).

  26. Лингвистические корпусы в терминоведении (понятие лингвистического корпуса, примеры корпусов, параллельный текст, параллельный корпус, проблемный корпус, единицы хранения в корпусах, корпусы в терминоведческих исследованиях, способы терминографического анализа корпуса параллельных текстов)

  27. Управление терминологией (понятие Terminology Management, структура управления терминологией, области применения управления терминологией, Terminology Management System, системы и сетевые сервисы управления терминологией, автоматический поиск в сетевых терминологических базах)

  28. Автоматическое извлечение терминологии (понятие и этапы извлечения терминологии, системы автоматического извлечения терминологии, примеры систем, функции и возможности PROMT Term).

  29. Тезаурусы (дефиниция, тезаурусы в лингвистике, области применения тезаурусов, примеры тезаурусов, тезаурус WordNet, синсеты, информационно-поисковые тезаурусы, цели разработки ИПТ, информационно-поисковые языки, дескрипторы, ключевые слова, правила включения терминов в тезаурус. Онтологии).

  30. Компьютерный перевод (понятие перевода, виды переводов, тотальный перевод.  Компьютерная обработка текста как перевод. Компьютерный межсемиотический перевод. Компьютерный межязыковой перевод. Компьютерная локализация. Перевод с современной глобальной информационной среде.

  31. История компьютерного перевода (основные события, периоды и даты, современное состояние, проблемы и перспективы)

  32. Cредства автоматизированного перевода (machine translation, machine-assisted translation, CAT, информационные технологии для перевода, перевод для ИТ, лингвистические информационные технологии)

  33. Интернационализация и локализация (понятие интернационализации и локализации, основные элементы и этапы  локализации, инструментарий локализации, шаблонные переводчики, примеры и характеристики специализированных систем локализации)

  34. Технологии компьютерного перевода (технологии Rule-based (Interlingua, Transfer consecutive, Transfer hierarchica) и Statistical-based, Hybrid-based, их характеристика и примеры реализации, проекты UNL, DLT, NLC, оценка эффективности технологии перевода)

  35. Системы и сервисы компьютерного перевода (понятие системы компьютерного перевода, основные параметры систем MT, сравнительные характеристики систем от ведущих разработчиков, система PROMT,  система Belazar, особенности и примеры сетевых переводческих сервисов)

  36. Тranslation Мemory (понятие, основы технологии, эффективность,  востребованность, стандарты, разработчики Translation Memory и их системы)

  37. Нейронные сети (модели компьютерной обработки информации, искусственные нейроны и нейронные сети, перцептрон, нейрокомпьютеры, области применения и правила использования нейронных сетей, ограничения нейронных сетей)

  38. Машинное обучение (Machine Learning, обучение по прецедентам, алгоритмы обучения нейронных сетей, метод обратного распространения ошибки, глубокое обучение, задачи и приложения машинного обучения, машинное обучение в обработке текста, машинное обучение на векторных моделях)

kmp