ВОПРОСЫ ПО КУРСУ
ОСНОВЫ КОМПЬЮТЕРНОЙ ЛИНГВИСТИКИ

 

 

ЭКЗАМЕНАЦИОННАЯ ОТМЕТКА - АВТОМАТОМ

1, 2, 3 - невыполненные лабораторные работы (в зависимости от числа задолженностей) или отказ от ответа

4 - выполнение всех лабораторных работ

5 - своевременное (регулярное и завершенное к последнему занятию) выполнение лабораторных работ

6 - своевременное выполнение всех лабораторных работ + конспект ответов на экз. вопросы

7 - своевременное выполнение всех лабораторных работ + аккуратный, грамотный и полный конспект

8 - своевременное выполнение лабораторных работ + аккуратный, грамотный и полный конспект + успешный персональный проект

9 - своевременное и безупречное выполнение лабораторных работ + аккуратный и грамотный конспект + успешный персональный проект + присутствие на всех лекциях

10 - за победу в GIMPS

 

 

Подготовка ответов предполагает использование:

  • материалов настоящего пособия (по гиперссылкам в вопросах),

  • материалов лекционных и практических занятий по курсу,

  • интернет-ресурсов,

  • актуализации своего опыта использования компьютерных программ, систем и сетевых сервисов,

  • рекомендуемой литературы.

 

 

  1. Понятие компьютерной лингвистики (термин «компьютерная лингвистика». Подходы к определению компьютерной лингвистики через объект, предмет, задачи, средства и методы. Математическая лингвистика. Вычислительная лингвистика. Приложения компьютерной лингвистики. Компьютерная лингвистика в современном языковом образовании).

  2. Языковедческие основы компьютерной лингвистики (эволюция научного понимания языка и задач его изучения (В. Фон Гумбольдт, Август Шлейхер, Бодуэн де Куртенэ, Ф. де Соссюр). Научные метафоры языка. Лингвистический поворот. Генеративные грамматики Н. Хомского, теория «Смысл-Текст»).

  3. Логико-математические основы компьютерной лингвистики (современная математика в периодизации А. Колмогорова. Логические и лингвистические проблемы современной математики. Проблема вычислимости и сложности. Математическая лингвистика. Компьютер как языковая машина. Лингвистические проблемы компьютерных наук. Идеи А. Тьюринга, А. Чёрча, А.Н. Колмогорова, А.А. Маркова).

  4. Компьютерные языки (искусственные и компьютерные языки, типы компьютерных языков, информационные языки, Universal Networking Language, языки поисковых запросов, языки разметки, дингвистические XML-приложения, языки программирования).

  5. Статистические методы в языкознании (статистические методы в языкознании. Частотные словари. Закон Ципфа. Использование частотных словарей. Статистика текстового документа. Статистический лингвистический анализ текста).

  6. Математические модели текста (метод математического моделирования, модель текста bag-of-words, частотная модель текста, веторная модель текста, частотный словарь как векторная модель текста, латентно-семантический анализ, нормализация и стемминг).

  7. Корпусная лингвистика (понятие "корпуса текстов", цель и задачи корпусной лингвистики, Брауновский корпус,  НКРЯ, OpenCorpora, ГИКРЯ, белорусские текстовые корпусы, двуязычные корпусы, создатели текстовых корпусов).

  8. Метаязыки и метаразметка (Метаязыки. Языки разметки. XML и его приложения в области работы с электронным текстом. Лингвистическая метаразметка (аннотирование).  Text Encoding Initiative)

  9. Технологии информационного поиска (понятие, типы и виды информационного поиска, поиск в электронном документе и в Интернете, языки поисковых запросов, поисковые службы, поисковая оптимизация, тенденции и перспективы развития поисковых сервисов).

  10. Языки поисковых запросов (Языки запросов. Регулярные выражения в языках поисковых запросов. XPath, XQuery, SQL. Языки запросов поисковых систем, их возможности. Структура языка запросов. Языковые инструменты поисковых систем)

  11. Регулярные выражения (Иерархия Хомского. Регулярные грамматики. Регулярные выражения. Структура регулярных выражений. Regex (regular expressions). Общая схема Regex. Сетевой инструментарий по Regex. Регулярные выражения в Microsoft Word)

  12. Лингвистическое программное обеспечение (понятие программного обеспечения, программы для работы с вербальной информацией, анализ и обработки текста в текстовом процессоре, сетевые сервисы лингвистического анализа и обработки текста).

  13. Технологии эффективного чтения (характеристики чтения с экрана, типы и характеристики электронных книг, e-book, e-reader, e-text, технологии Evernote Clearly и Rapid serial visual presentation)

  14. Технологии оптического распознавания (понятие и области применения OCR, алгоритмы оптического распознавания, характеристики и программы OCR, понятие Intelligent Character Recognition, системы распознавания рукописного текста).

  15. Технологии распознавания и синтеза устной речи (понятие речи, задачи построения речевого интерфейса, синтез речи по тексту, распознавание речи, технологии безголосового общения, технологии голосового поиска).

  16. Языковая инфраструктура синтеза и распознавания речи (CLI, голосовые платформы, Microsoft Speech Platform, Speech Recognition Grammar Specification, Speech Synthesis Markup Language, Speech Recognition Grammar Specification, теги параметров речи).

  17. VoiceXML и Speech Application Language (достоинства и ограниченря VoiceXML и Speech Application Language Tags, назначение тегов VoiceXML, структура VXML-документа VXML, VXML.RU).

  18. Технологии компьютерной лексикографии (предмет лексикографии, задачи и особенности компьютерной лексикографии, лексикографическое противоречие)

  19. Компьютерное терминоведение (понятия терминологии, терминоведения, проблемы и приложения компьютерного терминоведения)

  20. Понятие словаря (основные дефиниции словаря, лексикографическое определения понятия "словарь", объекты описания лингвистических словарей, основные структурные элементы проектирования словаря)

  21. Структура словаря и словарной статьи (композиция словаря, основные компонеты мега-, макро и   микроструктуры словаря, дефиниция словарной статьи и способы организации ее основных структурных элементов)

  22. Лексикографическая концепция (дефиниция лексикографической концепции, основы создания лексикографической концепции, пример лексикографической концепции, инструменты воплощения лексикографической концепции, лексикографическая концепция Викисловаря, словарность, Викисловарь)

  23. Электронные переводные словари (понятие электронного словаря, популярные типы электронных словарей, их пользовательские характеристики, сетевые словарные сервисы, Lingvo Live).

  24. Терминологические базы данных (понятие базы данных, структура базы данных, termbases, метаданные в termbases, типы терминологических баз данных по целевому и инструментальному назначению, примеры сетевых терминологических баз данных, создание терминологических баз данных).

  25. Лингвистические корпусы в терминоведении (понятие лингвистического корпуса, примеры корпусов, параллельный текст, параллельный корпус, проблемный корпус, единицы хранения в корпусах, корпусы в терминоведческих исследованиях, способы терминографического анализа корпуса параллельных текстов)

  26. Управление терминологией (понятие Terminology Management, структура управления терминологией, области применения управления терминологией, Terminology Management System, системы и сетевые сервисы управления терминологией, автоматический поиск в сетевых терминологических базах)

  27. Автоматическое извлечение терминологии (понятие и этапы извлечения терминологии, системы автоматического извлечения терминологии, примеры систем, функции и возможности PROMT Term).

  28. Тезаурусы (дефиниция, тезаурусы в лингвистике, области применения тезаурусов, примеры тезаурусов, тезаурус WordNet, синсеты, информационно-поисковые тезаурусы, цели разработки ИПТ, информационно-поисковые языки, дескрипторы, ключевые слова, правила включения терминов в тезаурус. Онтологии).

  29. Компьютерный перевод (понятие перевода, виды переводов, тотальный перевод.  Компьютерная обработка текста как перевод. Компьютерный межсемиотический перевод. Компьютерный межязыковой перевод. Компьютерная локализация. Перевод с современной глобальной информационной среде.

  30. Cредства автоматизированного перевода (machine translation, machine-assisted translation, CAT, информационные технологии для перевода, перевод для ИТ, лингвистические информационные технологии)

  31. Интернационализация и локализация (понятие интернационализации и локализации, основные элементы и этапы  локализации, инструментарий локализации, шаблонные переводчики, примеры и характеристики специализированных систем локализации)

  32. Технологии компьютерного перевода (технологии Rule-based (Interlingua, Transfer consecutive, Transfer hierarchica) и Statistical-based, Hybrid-based, их характеристика и примеры реализации, проекты UNL, DLT, NLC, оценка эффективности технологии перевода)

  33. Системы и сервисы компьютерного перевода (понятие системы компьютерного перевода, основные параметры систем MT, сравнительные характеристики систем от ведущих разработчиков, система PROMT,  система Belazar, особенности и примеры сетевых переводческих сервисов)

  34. Тranslation Мemory (понятие, основы технологии, эффективность,  востребованность, стандарты, разработчики Translation Memory и их системы)

  35. Нейронные сети (модели компьютерной обработки информации, искусственные нейроны и нейронные сети, перцептрон, нейрокомпьютеры, области применения и правила использования нейронных сетей, ограничения нейронных сетей)

  36. Машинное обучение (Machine Learning, обучение по прецедентам, алгоритмы обучения нейронных сетей, метод обратного распространения ошибки, глубокое обучение, задачи и приложения машинного обучения, машинное обучение в обработке текста, машинное обучение на векторных моделях)

 

 

Учреждение образования

"Брестский государственный университет имени А.С. Пушкина"

2016

 

 

kmp